inferrs kan lokale modellen aanbieden achter een OpenAI-compatibeleDocumentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
/v1-API. OpenClaw werkt met inferrs via het generieke openai-completions-pad.
| Eigenschap | Waarde |
|---|---|
| Provider-id | inferrs (aangepast; configureer onder models.providers.inferrs) |
| Plugin | geen — inferrs is geen gebundelde OpenClaw-provider-Plugin |
| Auth-env-var | Optioneel. Elke waarde werkt als je inferrs-server geen auth heeft |
| API | OpenAI-compatibel (openai-completions) |
| Voorgestelde base-URL | http://127.0.0.1:8080/v1 (of waar je inferrs-server ook draait) |
inferrs kan momenteel het beste worden behandeld als een aangepaste, zelf gehoste OpenAI-compatibele backend, niet als een speciale OpenClaw-provider-Plugin. Je configureert dit via models.providers.inferrs in plaats van een onboarding-keuzevlag. Als je een echte gebundelde Plugin met automatische detectie nodig hebt, zie SGLang of vLLM.Aan de slag
Volledig configuratievoorbeeld
Dit voorbeeld gebruikt Gemma 4 op een lokaleinferrs-server.
Opstarten op aanvraag
Inferrs kan ook alleen door OpenClaw worden gestart wanneer eeninferrs/...-model is
geselecteerd. Voeg localService toe aan dezelfde providervermelding:
command moet absoluut zijn. Gebruik which inferrs op de Gateway-host en zet dat
pad in de configuratie. Zie voor de volledige veldreferentie
Lokale modelservices.
Geavanceerde configuratie
Waarom requiresStringContent belangrijk is
Waarom requiresStringContent belangrijk is
Sommige OpenClaw maakt van pure tekstcontentonderdelen platte strings voordat het
verzoek wordt verzonden.
inferrs Chat Completions-routes accepteren alleen string
messages[].content, geen gestructureerde arrays met contentonderdelen.Kanttekening bij Gemma en toolschema's
Kanttekening bij Gemma en toolschema's
Sommige huidige combinaties van Dat schakelt OpenClaw’s toolschema-oppervlak voor het model uit en kan de promptdruk
op strengere lokale backends verlagen.Als heel kleine directe verzoeken nog steeds werken, maar normale OpenClaw-agentbeurten blijven
crashen binnen
inferrs + Gemma accepteren kleine directe
/v1/chat/completions-verzoeken, maar mislukken nog steeds bij volledige OpenClaw agent-runtime
beurten.Als dat gebeurt, probeer dan eerst dit:inferrs, ligt het resterende probleem meestal bij upstream model-/servergedrag
en niet bij OpenClaw’s transportlaag.Handmatige smoke-test
Handmatige smoke-test
Test na configuratie beide lagen:Als de eerste opdracht werkt maar de tweede mislukt, raadpleeg dan de probleemoplossingssectie hieronder.
Proxy-achtig gedrag
Proxy-achtig gedrag
inferrs wordt behandeld als een proxy-achtige OpenAI-compatibele /v1-backend, niet als een
native OpenAI-eindpunt.- Native OpenAI-specifieke request shaping is hier niet van toepassing
- Geen
service_tier, geen Responsesstore, geen prompt-cache-hints en geen OpenAI reasoning-compat payload shaping - Verborgen OpenClaw-attributieheaders (
originator,version,User-Agent) worden niet geïnjecteerd op aangepasteinferrsbase-URL’s
Probleemoplossing
curl /v1/models mislukt
curl /v1/models mislukt
inferrs draait niet, is niet bereikbaar of is niet gebonden aan de verwachte
host/poort. Zorg dat de server is gestart en luistert op het adres dat je
hebt geconfigureerd.messages[].content verwachtte een string
messages[].content verwachtte een string
Stel
compat.requiresStringContent: true in de modelvermelding in. Zie de
sectie requiresStringContent hierboven voor details.Directe /v1/chat/completions-aanroepen slagen, maar openclaw infer model run mislukt
Directe /v1/chat/completions-aanroepen slagen, maar openclaw infer model run mislukt
Probeer
compat.supportsTools: false in te stellen om het toolschema-oppervlak uit te schakelen.
Zie de kanttekening bij Gemma-toolschema’s hierboven.inferrs crasht nog steeds bij grotere agentbeurten
inferrs crasht nog steeds bij grotere agentbeurten
Als OpenClaw geen schemafouten meer krijgt, maar
inferrs nog steeds crasht bij grotere
agentbeurten, behandel dit dan als een upstream inferrs- of modelbeperking. Verminder
de promptdruk of stap over op een andere lokale backend of een ander model.Gerelateerd
Lokale modellen
OpenClaw uitvoeren tegen lokale modelservers.
Lokale modelservices
Lokale modelservers op aanvraag starten voor geconfigureerde providers.
Gateway-probleemoplossing
Lokale OpenAI-compatibele backends debuggen die probes doorstaan maar agent-runs laten mislukken.
Modelselectie
Overzicht van alle providers, modelrefs en failovergedrag.