inferrs può servire modelli locali dietro un’APIDocumentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
/v1 compatibile con OpenAI. OpenClaw funziona con inferrs tramite il percorso generico openai-completions.
| Proprietà | Valore |
|---|---|
| ID provider | inferrs (personalizzato; configura in models.providers.inferrs) |
| Plugin | nessuno — inferrs non è un provider plugin OpenClaw incluso |
| Variabile env auth | Facoltativa. Qualsiasi valore funziona se il server inferrs non ha auth |
| API | compatibile con OpenAI (openai-completions) |
| URL base suggerito | http://127.0.0.1:8080/v1 (o dovunque risieda il server inferrs) |
Al momento è meglio trattare
inferrs come backend autogestito personalizzato compatibile con OpenAI, non come provider plugin OpenClaw dedicato. Lo configuri tramite models.providers.inferrs anziché tramite un flag di scelta di onboarding. Se ti serve un vero Plugin incluso con rilevamento automatico, consulta SGLang o vLLM.Introduzione
Esempio di configurazione completo
Questo esempio usa Gemma 4 su un serverinferrs locale.
Avvio on demand
Inferrs può anche essere avviato da OpenClaw solo quando viene selezionato un modelloinferrs/.... Aggiungi localService alla stessa voce provider:
command deve essere assoluto. Usa which inferrs sull’host Gateway e inserisci quel percorso nella configurazione. Per il riferimento completo dei campi, consulta Servizi di modelli locali.
Configurazione avanzata
Perché requiresStringContent è importante
Perché requiresStringContent è importante
Alcune route Chat Completions di OpenClaw appiattirà le parti di contenuto di solo testo in stringhe semplici prima di inviare la richiesta.
inferrs accettano solo messages[].content come stringa, non array strutturati di parti di contenuto.Avvertenza su Gemma e schema degli strumenti
Avvertenza su Gemma e schema degli strumenti
Alcune combinazioni attuali di Questo disabilita la superficie dello schema degli strumenti di OpenClaw per il modello e può ridurre la pressione del prompt su backend locali più rigidi.Se le piccole richieste dirette continuano a funzionare ma i normali turni agente OpenClaw continuano a bloccarsi dentro
inferrs + Gemma accettano piccole richieste dirette a /v1/chat/completions, ma falliscono ancora nei turni completi del runtime agente OpenClaw.Se succede, prova prima questo:inferrs, il problema restante è di solito il comportamento del modello/server upstream anziché il livello di trasporto di OpenClaw.Smoke test manuale
Smoke test manuale
Dopo la configurazione, testa entrambi i livelli:Se il primo comando funziona ma il secondo fallisce, controlla la sezione di risoluzione dei problemi qui sotto.
Comportamento in stile proxy
Comportamento in stile proxy
inferrs viene trattato come backend /v1 compatibile con OpenAI in stile proxy, non come endpoint OpenAI nativo.- La formattazione delle richieste solo per OpenAI nativo non si applica qui
- Nessun
service_tier, nessunstoreResponses, nessun suggerimento di cache del prompt e nessuna formattazione del payload di compatibilità con il reasoning OpenAI - Gli header di attribuzione OpenClaw nascosti (
originator,version,User-Agent) non vengono iniettati sugli URL baseinferrspersonalizzati
Risoluzione dei problemi
curl /v1/models fallisce
curl /v1/models fallisce
inferrs non è in esecuzione, non è raggiungibile o non è associato all’host/porta previsto. Assicurati che il server sia avviato e in ascolto sull’indirizzo che hai configurato.messages[].content expected a string
messages[].content expected a string
Imposta
compat.requiresStringContent: true nella voce del modello. Consulta la sezione requiresStringContent sopra per i dettagli.Le chiamate dirette a /v1/chat/completions riescono ma openclaw infer model run fallisce
Le chiamate dirette a /v1/chat/completions riescono ma openclaw infer model run fallisce
Prova a impostare
compat.supportsTools: false per disabilitare la superficie dello schema degli strumenti. Consulta l’avvertenza sullo schema degli strumenti di Gemma sopra.inferrs continua a bloccarsi su turni agente più grandi
inferrs continua a bloccarsi su turni agente più grandi
Se OpenClaw non riceve più errori di schema ma
inferrs continua a bloccarsi su turni agente più grandi, trattalo come una limitazione upstream di inferrs o del modello. Riduci la pressione del prompt oppure passa a un backend locale o modello diverso.Correlati
Modelli locali
Esecuzione di OpenClaw con server di modelli locali.
Servizi di modelli locali
Avvio on demand di server di modelli locali per provider configurati.
Risoluzione dei problemi Gateway
Debug di backend locali compatibili con OpenAI che superano le sonde ma falliscono nelle esecuzioni agente.
Selezione del modello
Panoramica di tutti i provider, riferimenti dei modelli e comportamento di failover.