inferrs puede servir modelos locales detrás de una APIDocumentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
/v1 compatible con OpenAI. OpenClaw funciona con inferrs mediante la ruta genérica openai-completions.
| Propiedad | Valor |
|---|---|
| ID de proveedor | inferrs (personalizado; configurar en models.providers.inferrs) |
| Plugin | ninguno — inferrs no es un Plugin de proveedor incluido con OpenClaw |
| Variable de entorno de autenticación | Opcional. Cualquier valor funciona si tu servidor inferrs no tiene autenticación |
| API | Compatible con OpenAI (openai-completions) |
| URL base sugerida | http://127.0.0.1:8080/v1 (o donde se ejecute tu servidor inferrs) |
Actualmente, es mejor tratar
inferrs como un backend personalizado autohospedado compatible con OpenAI, no como un Plugin de proveedor dedicado de OpenClaw. Lo configuras mediante models.providers.inferrs en lugar de una marca de elección de incorporación. Si necesitas un verdadero Plugin incluido con descubrimiento automático, consulta SGLang o vLLM.Primeros pasos
Ejemplo de configuración completo
Este ejemplo usa Gemma 4 en un servidor localinferrs.
Inicio bajo demanda
OpenClaw también puede iniciar Inferrs solo cuando se selecciona un modeloinferrs/.... Añade localService a la misma entrada de proveedor:
command debe ser absoluto. Usa which inferrs en el host del Gateway y coloca esa
ruta en la configuración. Para la referencia completa de campos, consulta
Servicios de modelos locales.
Configuración avanzada
Por qué requiresStringContent importa
Por qué requiresStringContent importa
Algunas rutas de Chat Completions de OpenClaw convertirá las partes de contenido de texto puro en cadenas simples antes de enviar
la solicitud.
inferrs solo aceptan
messages[].content como cadena, no matrices estructuradas de partes de contenido.Advertencia sobre Gemma y el esquema de herramientas
Advertencia sobre Gemma y el esquema de herramientas
Algunas combinaciones actuales de Eso desactiva la superficie de esquema de herramientas de OpenClaw para el modelo y puede reducir la presión del prompt
en backends locales más estrictos.Si las solicitudes directas mínimas aún funcionan, pero los turnos normales de agentes de OpenClaw siguen
fallando dentro de
inferrs + Gemma aceptan solicitudes directas pequeñas a
/v1/chat/completions, pero aun así fallan en turnos completos del entorno de ejecución
de agentes de OpenClaw.Si eso ocurre, prueba esto primero:inferrs, el problema restante suele ser comportamiento ascendente del modelo o servidor,
no la capa de transporte de OpenClaw.Prueba de humo manual
Prueba de humo manual
Una vez configurado, prueba ambas capas:Si el primer comando funciona pero el segundo falla, revisa la sección de solución de problemas a continuación.
Comportamiento de estilo proxy
Comportamiento de estilo proxy
inferrs se trata como un backend /v1 de estilo proxy compatible con OpenAI, no como un
endpoint nativo de OpenAI.- La adaptación de solicitudes exclusiva de OpenAI nativo no se aplica aquí
- Sin
service_tier, sin Responsesstore, sin indicaciones de caché de prompts y sin adaptación de carga útil de compatibilidad de razonamiento de OpenAI - Los encabezados ocultos de atribución de OpenClaw (
originator,version,User-Agent) no se inyectan en URL base personalizadas deinferrs
Solución de problemas
curl /v1/models falla
curl /v1/models falla
inferrs no se está ejecutando, no es accesible o no está enlazado al
host/puerto esperado. Asegúrate de que el servidor esté iniciado y escuchando en la dirección que
configuraste.messages[].content esperaba una cadena
messages[].content esperaba una cadena
Define
compat.requiresStringContent: true en la entrada del modelo. Consulta la
sección requiresStringContent anterior para obtener detalles.Las llamadas directas a /v1/chat/completions pasan, pero openclaw infer model run falla
Las llamadas directas a /v1/chat/completions pasan, pero openclaw infer model run falla
Prueba definir
compat.supportsTools: false para desactivar la superficie de esquema de herramientas.
Consulta la advertencia sobre el esquema de herramientas de Gemma anterior.inferrs sigue fallando en turnos de agente más grandes
inferrs sigue fallando en turnos de agente más grandes
Si OpenClaw ya no recibe errores de esquema, pero
inferrs sigue fallando en turnos de agente
más grandes, trátalo como una limitación ascendente de inferrs o del modelo. Reduce
la presión del prompt o cambia a otro backend o modelo local.Relacionado
Modelos locales
Ejecutar OpenClaw contra servidores de modelos locales.
Servicios de modelos locales
Iniciar servidores de modelos locales bajo demanda para proveedores configurados.
Solución de problemas del Gateway
Depurar backends locales compatibles con OpenAI que pasan las pruebas, pero fallan en ejecuciones de agentes.
Selección de modelos
Resumen de todos los proveedores, referencias de modelo y comportamiento de conmutación por error.