inferrs może udostępniać modele lokalne za APIDocumentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
/v1 zgodnym z OpenAI. OpenClaw współpracuje z inferrs przez ogólną ścieżkę openai-completions.
| Właściwość | Wartość |
|---|---|
| Identyfikator dostawcy | inferrs (niestandardowy; skonfiguruj w models.providers.inferrs) |
| Plugin | brak — inferrs nie jest dołączonym pluginem dostawcy OpenClaw |
| Zmienna środowiskowa uwierzytelniania | Opcjonalna. Dowolna wartość działa, jeśli Twój serwer inferrs nie ma uwierzytelniania |
| API | Zgodne z OpenAI (openai-completions) |
| Sugerowany bazowy URL | http://127.0.0.1:8080/v1 (lub tam, gdzie działa Twój serwer inferrs) |
inferrs najlepiej obecnie traktować jako niestandardowy, samodzielnie hostowany backend zgodny z OpenAI, a nie dedykowany plugin dostawcy OpenClaw. Konfigurujesz go przez models.providers.inferrs, a nie przez flagę wyboru podczas onboardingu. Jeśli potrzebujesz prawdziwego dołączonego pluginu z automatycznym wykrywaniem, zobacz SGLang lub vLLM.Pierwsze kroki
Pełny przykład konfiguracji
Ten przykład używa Gemma 4 na lokalnym serwerzeinferrs.
Uruchamianie na żądanie
Inferrs może być też uruchamiany przez OpenClaw tylko wtedy, gdy zostanie wybrany modelinferrs/.... Dodaj localService do tego samego wpisu dostawcy:
command musi być ścieżką bezwzględną. Użyj which inferrs na hoście Gateway i umieść tę
ścieżkę w konfiguracji. Pełny opis pól znajdziesz w
Usługach modeli lokalnych.
Zaawansowana konfiguracja
Dlaczego requiresStringContent ma znaczenie
Dlaczego requiresStringContent ma znaczenie
Niektóre trasy Chat Completions w OpenClaw spłaszczy części treści zawierające czysty tekst do zwykłych ciągów znaków przed wysłaniem
żądania.
inferrs akceptują tylko ciąg znaków
messages[].content, a nie strukturalne tablice części treści.Gemma i zastrzeżenie dotyczące schematu narzędzi
Gemma i zastrzeżenie dotyczące schematu narzędzi
Niektóre obecne kombinacje To wyłącza powierzchnię schematu narzędzi OpenClaw dla modelu i może zmniejszyć presję promptu
na bardziej rygorystyczne lokalne backendy.Jeśli bardzo małe bezpośrednie żądania nadal działają, ale zwykłe tury agenta OpenClaw nadal
kończą się awarią wewnątrz
inferrs + Gemma akceptują małe bezpośrednie
żądania /v1/chat/completions, ale nadal zawodzą przy pełnych turach środowiska wykonawczego agenta OpenClaw.Jeśli tak się stanie, najpierw spróbuj tego:inferrs, pozostały problem zwykle dotyczy zachowania modelu lub serwera upstream,
a nie warstwy transportowej OpenClaw.Ręczny test smoke
Ręczny test smoke
Po skonfigurowaniu przetestuj obie warstwy:Jeśli pierwsze polecenie działa, a drugie kończy się niepowodzeniem, sprawdź poniższą sekcję rozwiązywania problemów.
Zachowanie w stylu proxy
Zachowanie w stylu proxy
inferrs jest traktowany jako backend /v1 zgodny z OpenAI w stylu proxy, a nie jako
natywny punkt końcowy OpenAI.- Natywne kształtowanie żądań tylko dla OpenAI nie ma tutaj zastosowania
- Brak
service_tier, brak Responsesstore, brak podpowiedzi prompt-cache i brak kształtowania payloadu zgodnego z rozumowaniem OpenAI - Ukryte nagłówki atrybucji OpenClaw (
originator,version,User-Agent) nie są wstrzykiwane dla niestandardowych bazowych URLinferrs
Rozwiązywanie problemów
curl /v1/models kończy się niepowodzeniem
curl /v1/models kończy się niepowodzeniem
inferrs nie działa, jest nieosiągalny albo nie jest powiązany z oczekiwanym
hostem/portem. Upewnij się, że serwer jest uruchomiony i nasłuchuje pod adresem, który
skonfigurowano.messages[].content oczekiwano ciągu znaków
messages[].content oczekiwano ciągu znaków
Ustaw
compat.requiresStringContent: true we wpisie modelu. Szczegóły znajdziesz w
sekcji requiresStringContent powyżej.Bezpośrednie wywołania /v1/chat/completions przechodzą, ale openclaw infer model run kończy się niepowodzeniem
Bezpośrednie wywołania /v1/chat/completions przechodzą, ale openclaw infer model run kończy się niepowodzeniem
Spróbuj ustawić
compat.supportsTools: false, aby wyłączyć powierzchnię schematu narzędzi.
Zobacz zastrzeżenie dotyczące schematu narzędzi Gemma powyżej.inferrs nadal ulega awarii przy większych turach agenta
inferrs nadal ulega awarii przy większych turach agenta
Jeśli OpenClaw nie otrzymuje już błędów schematu, ale
inferrs nadal ulega awarii przy większych
turach agenta, potraktuj to jako ograniczenie upstream inferrs lub modelu. Zmniejsz
presję promptu albo przełącz się na inny lokalny backend lub model.Powiązane
Modele lokalne
Uruchamianie OpenClaw z lokalnymi serwerami modeli.
Usługi modeli lokalnych
Uruchamianie lokalnych serwerów modeli na żądanie dla skonfigurowanych dostawców.
Rozwiązywanie problemów z Gateway
Debugowanie lokalnych backendów zgodnych z OpenAI, które przechodzą próby, ale zawodzą przy uruchomieniach agenta.
Wybór modelu
Omówienie wszystkich dostawców, referencji modeli i zachowania failover.