Documentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
openclaw infer to kanoniczny bezgłowy interfejs dla przepływów pracy wnioskowania wspieranych przez dostawców.
Celowo udostępnia rodziny możliwości, a nie surowe nazwy RPC Gateway ani surowe identyfikatory narzędzi agentów.
Przekształć infer w umiejętność
Skopiuj i wklej to do agenta:- mapować typowe intencje użytkownika na właściwe podpolecenie infer
- zawierać kilka kanonicznych przykładów infer dla obsługiwanych przepływów pracy
- preferować
openclaw infer ...w przykładach i sugestiach - unikać ponownego dokumentowania całego interfejsu infer w treści umiejętności
openclaw infer model runopenclaw infer image generateopenclaw infer audio transcribeopenclaw infer tts convertopenclaw infer web searchopenclaw infer embedding create
Dlaczego warto używać infer
openclaw infer zapewnia jedno spójne CLI dla zadań wnioskowania wspieranych przez dostawców w OpenClaw.
Korzyści:
- Używaj dostawców i modeli już skonfigurowanych w OpenClaw zamiast tworzyć jednorazowe wrappery dla każdego backendu.
- Trzymaj przepływy pracy związane z modelami, obrazami, transkrypcją audio, TTS, wideo, siecią i embeddingami w jednym drzewie poleceń.
- Używaj stabilnego kształtu wyjścia
--jsondla skryptów, automatyzacji i przepływów pracy sterowanych przez agentów. - Preferuj własny interfejs OpenClaw, gdy zadanie zasadniczo polega na „uruchomieniu wnioskowania”.
- Używaj normalnej ścieżki lokalnej bez wymagania Gateway dla większości poleceń infer.
openclaw infer ..., gdy testy dostawców niższego poziomu są już zielone. Sprawdza to dostarczane CLI, ładowanie konfiguracji, rozwiązywanie domyślnego agenta, aktywację dołączonego pluginu oraz współdzielone środowisko wykonawcze możliwości, zanim zostanie wykonane żądanie do dostawcy.
Drzewo poleceń
Typowe zadania
Ta tabela mapuje typowe zadania wnioskowania na odpowiadające im polecenie infer.| Zadanie | Polecenie | Uwagi |
|---|---|---|
| Uruchom prompt tekstowy/modelu | openclaw infer model run --prompt "..." --json | Domyślnie używa normalnej ścieżki lokalnej |
| Uruchom prompt modelu na obrazach | openclaw infer model run --prompt "Describe this" --file ./image.png --model provider/model | Powtórz --file dla wielu wejść obrazów |
| Wygeneruj obraz | openclaw infer image generate --prompt "..." --json | Użyj image edit, gdy zaczynasz od istniejącego pliku |
| Opisz plik obrazu | openclaw infer image describe --file ./image.png --prompt "..." --json | --model musi być modelem <provider/model> obsługującym obrazy |
| Przepisz audio | openclaw infer audio transcribe --file ./memo.m4a --json | --model musi mieć postać <provider/model> |
| Zsyntetyzuj mowę | openclaw infer tts convert --text "..." --output ./speech.mp3 --json | tts status jest zorientowane na Gateway |
| Wygeneruj wideo | openclaw infer video generate --prompt "..." --json | Obsługuje podpowiedzi dostawcy, takie jak --resolution |
| Opisz plik wideo | openclaw infer video describe --file ./clip.mp4 --json | --model musi mieć postać <provider/model> |
| Przeszukaj sieć | openclaw infer web search --query "..." --json | |
| Pobierz stronę internetową | openclaw infer web fetch --url https://example.com --json | |
| Utwórz embeddingi | openclaw infer embedding create --text "..." --json |
Zachowanie
openclaw infer ...jest podstawowym interfejsem CLI dla tych przepływów pracy.- Używaj
--json, gdy wyjście będzie używane przez inne polecenie lub skrypt. - Używaj
--provideralbo--model provider/model, gdy wymagany jest konkretny backend. - Używaj
model run --thinking <level>, aby przekazać jednorazowy poziom myślenia/rozumowania (off,minimal,low,medium,high,adaptive,xhighalbomax) przy zachowaniu surowego uruchomienia. - Dla
image describe,audio transcribeivideo describeopcja--modelmusi używać formy<provider/model>. - Dla
image describejawny--modeluruchamia bezpośrednio ten model/dostawcę. Model musi obsługiwać obrazy w katalogu modeli lub konfiguracji dostawcy.codex/<model>uruchamia ograniczony przebieg rozumienia obrazu przez serwer aplikacji Codex;openai-codex/<model>używa ścieżki dostawcy OAuth OpenAI Codex. - Bezstanowe polecenia wykonania domyślnie działają lokalnie.
- Polecenia stanu zarządzanego przez Gateway domyślnie używają Gateway.
- Normalna ścieżka lokalna nie wymaga działania Gateway.
- Lokalne
model runto lekka jednorazowa kompletacja dostawcy. Rozwiązuje skonfigurowany model agenta i uwierzytelnianie, ale nie uruchamia tury agenta czatu, nie ładuje narzędzi ani nie otwiera dołączonych serwerów MCP. model run --fileprzyjmuje pliki obrazów, wykrywa ich typ MIME i wysyła je z podanym promptem do wybranego modelu. Powtórz--filedla wielu obrazów.model run --fileodrzuca wejścia inne niż obrazy. Użyjinfer audio transcribedla plików audio iinfer video describedla plików wideo.model run --gatewaysprawdza trasowanie Gateway, zapisane uwierzytelnianie, wybór dostawcy i osadzone środowisko wykonawcze, ale nadal działa jako surowa próba modelu: wysyła podany prompt i ewentualne załączniki obrazów bez wcześniejszego transkryptu sesji, kontekstu bootstrap/AGENTS, składania przez silnik kontekstu, narzędzi ani dołączonych serwerów MCP.model run --gateway --model <provider/model>wymaga zaufanego poświadczenia operatora Gateway, ponieważ żądanie prosi Gateway o uruchomienie jednorazowego nadpisania dostawcy/modelu.- Lokalne
model run --thinkingużywa lekkiej ścieżki kompletacji dostawcy; poziomy specyficzne dla dostawcy, takie jakadaptiveimax, są mapowane na najbliższy przenośny poziom prostej kompletacji.
Model
Użyjmodel do wnioskowania tekstowego wspieranego przez dostawcę oraz inspekcji modeli/dostawców.
<provider/model>, aby wykonać smoke test konkretnego dostawcy bez uruchamiania Gateway ani ładowania pełnego interfejsu narzędzi agenta:
- Lokalne
model runto najwęższy smoke test CLI dla kondycji dostawcy/modelu/uwierzytelniania, ponieważ dla dostawców innych niż Codex wysyła do wybranego modelu tylko podany prompt. - Lokalne
model run --model <provider/model>może używać dokładnych dołączonych statycznych wierszy katalogu zmodels list --all, zanim ten dostawca zostanie zapisany w konfiguracji. Uwierzytelnianie dostawcy nadal jest wymagane; brakujące poświadczenia kończą się błędami uwierzytelniania, a nieUnknown model. - Dla prób rozumowania Mistral Medium 3.5 pozostaw temperaturę nieustawioną/domyślną. Mistral odrzuca
reasoning_effort="high"plustemperature: 0; użyjmistral/mistral-medium-3-5z domyślną temperaturą albo niezerową wartością trybu rozumowania, taką jak0.7. - Lokalne próby
openai-codex/*są wąskim wyjątkiem: OpenClaw dodaje minimalną instrukcję systemową, aby transport Codex Responses mógł wypełnić wymagane poleinstructions, bez dodawania pełnego kontekstu agenta, narzędzi, pamięci ani transkryptu sesji. - Lokalne
model run --filezachowuje tę lekką ścieżkę i dołącza zawartość obrazu bezpośrednio do pojedynczej wiadomości użytkownika. Typowe pliki obrazów, takie jak PNG, JPEG i WebP, działają, gdy ich typ MIME zostanie wykryty jakoimage/*; nieobsługiwane lub nierozpoznane pliki kończą się błędem przed wywołaniem dostawcy. model run --filejest najlepsze, gdy chcesz bezpośrednio przetestować wybrany multimodalny model tekstowy. Użyjinfer image describe, gdy chcesz skorzystać z wyboru dostawcy rozumienia obrazów w OpenClaw i domyślnego trasowania modelu obrazowego.- Wybrany model musi obsługiwać wejście obrazowe; modele tylko tekstowe mogą odrzucić żądanie na warstwie dostawcy.
model run --promptmusi zawierać tekst inny niż białe znaki; puste prompty są odrzucane przed wywołaniem lokalnych dostawców lub Gateway.- Lokalne
model runkończy się kodem niezerowym, gdy dostawca nie zwróci żadnego wyjścia tekstowego, więc niedostępni lokalni dostawcy i puste kompletacje nie wyglądają jak udane próby. - Użyj
model run --gateway, gdy musisz przetestować trasowanie Gateway, konfigurację środowiska wykonawczego agenta lub stan dostawcy zarządzany przez Gateway, zachowując surowe wejście modelu. Użyjopenclaw agentalbo interfejsów czatu, gdy chcesz pełnego kontekstu agenta, narzędzi, pamięci i transkryptu sesji. model auth login,model auth logoutimodel auth statuszarządzają zapisanym stanem uwierzytelniania dostawcy.
Obraz
Użyjimage do generowania, edycji i opisu.
-
Używaj
image edit, gdy zaczynasz od istniejących plików wejściowych. -
Używaj
--size,--aspect-ratiolub--resolutionzimage editdla dostawców/modeli, które obsługują wskazówki geometrii przy edycjach obrazów referencyjnych. -
Używaj
--output-format png --background transparentz--model openai/gpt-image-1.5dla wyjścia OpenAI PNG z przezroczystym tłem;--openai-backgroundpozostaje dostępne jako alias specyficzny dla OpenAI. Dostawcy, którzy nie deklarują obsługi tła, zgłaszają tę wskazówkę jako zignorowane nadpisanie. -
Używaj
image providers --json, aby sprawdzić, którzy dołączani dostawcy obrazów są wykrywalni, skonfigurowani, wybrani oraz jakie możliwości generowania/edycji udostępnia każdy dostawca. -
Używaj
image generate --model <provider/model> --jsonjako najwęższego aktywnego testu CLI dla zmian w generowaniu obrazów. Przykład:Odpowiedź JSON raportujeok,provider,model,attemptsoraz zapisane ścieżki wyjściowe. Gdy ustawiono--output, końcowe rozszerzenie może wynikać ze zwróconego przez dostawcę typu MIME. -
Dla
image describeiimage describe-manyużywaj--prompt, aby przekazać modelowi wizyjnemu instrukcję specyficzną dla zadania, taką jak OCR, porównanie, inspekcja UI lub zwięzły podpis. -
Używaj
--timeout-msz wolnymi lokalnymi modelami wizyjnymi lub zimnymi startami Ollama. -
Dla
image describeparametr--modelmusi być obsługującym obrazy<provider/model>. -
Dla lokalnych modeli wizyjnych Ollama najpierw pobierz model i ustaw
OLLAMA_API_KEYna dowolną wartość zastępczą, na przykładollama-local. Zobacz Ollama.
Dźwięk
Używajaudio do transkrypcji plików.
audio transcribesłuży do transkrypcji plików, a nie do zarządzania sesjami w czasie rzeczywistym.--modelmusi mieć postać<provider/model>.
TTS
Używajtts do syntezy mowy i stanu dostawcy TTS.
tts statusdomyślnie używa Gateway, ponieważ odzwierciedla stan TTS zarządzany przez Gateway.- Używaj
tts providers,tts voicesitts set-provider, aby sprawdzać i konfigurować zachowanie TTS.
Wideo
Używajvideo do generowania i opisu.
video generateakceptuje--size,--aspect-ratio,--resolution,--duration,--audio,--watermarki--timeout-msoraz przekazuje je do środowiska wykonawczego generowania wideo.--modelmusi mieć postać<provider/model>dlavideo describe.
Sieć
Używajweb do przepływów pracy wyszukiwania i pobierania.
- Używaj
web providers, aby sprawdzać dostępnych, skonfigurowanych i wybranych dostawców.
Osadzanie
Używajembedding do tworzenia wektorów i inspekcji dostawców osadzania.
Dane wyjściowe JSON
Polecenia infer normalizują dane wyjściowe JSON w ramach wspólnej koperty:okcapabilitytransportprovidermodelattemptsoutputserror
outputs zawiera pliki zapisane przez OpenClaw. Do automatyzacji używaj
path, mimeType, size oraz wszelkich wymiarów specyficznych dla mediów w tej tablicy,
zamiast parsować czytelny dla człowieka stdout.
Częste pułapki
Uwagi
openclaw capability ...jest aliasem dlaopenclaw infer ....