Documentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
openclaw infer ist die kanonische Headless-Oberfläche für Provider-gestützte Inferenz-Workflows.
Es stellt absichtlich Capability-Familien bereit, nicht rohe Gateway-RPC-Namen und nicht rohe Agent-Tool-IDs.
infer in einen Skill umwandeln
Kopieren Sie dies und fügen Sie es in einen Agenten ein:- häufige Benutzerabsichten dem richtigen infer-Unterbefehl zuordnen
- einige kanonische infer-Beispiele für die abgedeckten Workflows enthalten
- in Beispielen und Vorschlägen
openclaw infer ...bevorzugen - vermeiden, die gesamte infer-Oberfläche im Skill-Text erneut zu dokumentieren
openclaw infer model runopenclaw infer image generateopenclaw infer audio transcribeopenclaw infer tts convertopenclaw infer web searchopenclaw infer embedding create
Warum infer verwenden
openclaw infer bietet eine konsistente CLI für Provider-gestützte Inferenzaufgaben innerhalb von OpenClaw.
Vorteile:
- Verwenden Sie die bereits in OpenClaw konfigurierten Provider und Modelle, anstatt einmalige Wrapper für jedes Backend einzurichten.
- Halten Sie Workflows für Modell, Bild, Audiotranskription, TTS, Video, Web und Embedding unter einem Befehlsbaum.
- Verwenden Sie eine stabile
--json-Ausgabeform für Skripte, Automatisierung und Agent-gesteuerte Workflows. - Bevorzugen Sie eine OpenClaw-Erstanbieteroberfläche, wenn die Aufgabe im Kern „Inferenz ausführen“ lautet.
- Verwenden Sie für die meisten infer-Befehle den normalen lokalen Pfad, ohne den Gateway zu benötigen.
openclaw infer ... bevorzugen, sobald Low-Level-Provider-Tests grün sind. Es prüft die ausgelieferte CLI, das Laden der Konfiguration, die Auflösung des Standard-Agenten, die Aktivierung gebündelter Plugins und die gemeinsame Capability-Laufzeit, bevor die Provider-Anfrage gestellt wird.
Befehlsbaum
Häufige Aufgaben
Diese Tabelle ordnet häufige Inferenzaufgaben dem entsprechenden infer-Befehl zu.| Aufgabe | Befehl | Hinweise |
|---|---|---|
| Einen Text-/Modell-Prompt ausführen | openclaw infer model run --prompt "..." --json | Verwendet standardmäßig den normalen lokalen Pfad |
| Einen Modell-Prompt mit Bildern ausführen | openclaw infer model run --prompt "Describe this" --file ./image.png --model provider/model | Wiederholen Sie --file für mehrere Bildeingaben |
| Ein Bild generieren | openclaw infer image generate --prompt "..." --json | Verwenden Sie image edit, wenn Sie mit einer vorhandenen Datei beginnen |
| Eine Bilddatei beschreiben | openclaw infer image describe --file ./image.png --prompt "..." --json | --model muss ein bildfähiges <provider/model> sein |
| Audio transkribieren | openclaw infer audio transcribe --file ./memo.m4a --json | --model muss <provider/model> sein |
| Sprache synthetisieren | openclaw infer tts convert --text "..." --output ./speech.mp3 --json | tts status ist Gateway-orientiert |
| Ein Video generieren | openclaw infer video generate --prompt "..." --json | Unterstützt Provider-Hinweise wie --resolution |
| Eine Videodatei beschreiben | openclaw infer video describe --file ./clip.mp4 --json | --model muss <provider/model> sein |
| Das Web durchsuchen | openclaw infer web search --query "..." --json | |
| Eine Webseite abrufen | openclaw infer web fetch --url https://example.com --json | |
| Embeddings erstellen | openclaw infer embedding create --text "..." --json |
Verhalten
openclaw infer ...ist die primäre CLI-Oberfläche für diese Workflows.- Verwenden Sie
--json, wenn die Ausgabe von einem anderen Befehl oder Skript verarbeitet wird. - Verwenden Sie
--provideroder--model provider/model, wenn ein bestimmtes Backend erforderlich ist. - Verwenden Sie
model run --thinking <level>, um eine einmalige Thinking-/Reasoning-Stufe (off,minimal,low,medium,high,adaptive,xhighodermax) zu übergeben und den Lauf dabei roh zu halten. - Für
image describe,audio transcribeundvideo describemuss--modeldie Form<provider/model>verwenden. - Für
image describeführt ein explizites--modeldieses Provider/Modell direkt aus. Das Modell muss im Modellkatalog oder in der Provider-Konfiguration bildfähig sein.codex/<model>führt einen begrenzten Bildverständnis-Turn des Codex-App-Servers aus;openai-codex/<model>verwendet den OAuth-Provider-Pfad von OpenAI Codex. - Zustandslose Ausführungsbefehle verwenden standardmäßig lokal.
- Gateway-verwaltete Zustandsbefehle verwenden standardmäßig den Gateway.
- Der normale lokale Pfad erfordert nicht, dass der Gateway läuft.
- Lokales
model runist eine schlanke einmalige Provider-Completion. Es löst das konfigurierte Agentenmodell und die Authentifizierung auf, startet aber keinen Chat-Agent-Turn, lädt keine Tools und öffnet keine gebündelten MCP-Server. model run --fileakzeptiert Bilddateien, erkennt deren MIME-Typ und sendet sie mit dem angegebenen Prompt an das ausgewählte Modell. Wiederholen Sie--filefür mehrere Bilder.model run --filelehnt Nicht-Bildeingaben ab. Verwenden Sieinfer audio transcribefür Audiodateien undinfer video describefür Videodateien.model run --gatewayprüft Gateway-Routing, gespeicherte Authentifizierung, Provider-Auswahl und die eingebettete Laufzeit, läuft aber weiterhin als roher Modell-Probe: Es sendet den angegebenen Prompt und etwaige Bildanhänge ohne vorheriges Sitzungstranskript, Bootstrap-/AGENTS-Kontext, Context-Engine-Zusammenstellung, Tools oder gebündelte MCP-Server.model run --gateway --model <provider/model>erfordert vertrauenswürdige Operator-Gateway-Anmeldedaten, da die Anfrage den Gateway auffordert, einen einmaligen Provider/Modell-Override auszuführen.- Lokales
model run --thinkingverwendet den schlanken Provider-Completion-Pfad; Provider-spezifische Stufen wieadaptiveundmaxwerden der nächstliegenden portablen Simple-Completion-Stufe zugeordnet.
Modell
Verwenden Siemodel für Provider-gestützte Textinferenz und Modell-/Provider-Inspektion.
<provider/model>-Referenzen, um einen bestimmten Provider per Smoke-Test zu prüfen, ohne den Gateway zu starten oder die vollständige Agent-Tool-Oberfläche zu laden:
- Lokales
model runist der engste CLI-Smoke-Test für Provider-/Modell-/Authentifizierungszustand, da es für Nicht-Codex-Provider nur den angegebenen Prompt an das ausgewählte Modell sendet. - Lokales
model run --model <provider/model>kann exakte gebündelte statische Katalogzeilen ausmodels list --allverwenden, bevor dieser Provider in die Konfiguration geschrieben wurde. Provider-Authentifizierung ist weiterhin erforderlich; fehlende Anmeldedaten schlagen als Authentifizierungsfehler fehl, nicht alsUnknown model. - Lassen Sie bei Reasoning-Probes für Mistral Medium 3.5 die Temperatur ungesetzt bzw. auf dem Standardwert. Mistral lehnt
reasoning_effort="high"plustemperature: 0ab; verwenden Siemistral/mistral-medium-3-5mit Standardtemperatur oder einem Reasoning-Modus-Wert ungleich null, etwa0.7. - Lokale
openai-codex/*-Probes sind die enge Ausnahme: OpenClaw fügt eine minimale Systemanweisung hinzu, damit der Codex-Responses-Transport sein erforderlichesinstructions-Feld befüllen kann, ohne vollständigen Agentenkontext, Tools, Memory oder Sitzungstranskript hinzuzufügen. - Lokales
model run --filebehält diesen schlanken Pfad bei und hängt Bildinhalte direkt an die einzelne Benutzernachricht an. Gängige Bilddateien wie PNG, JPEG und WebP funktionieren, wenn ihr MIME-Typ alsimage/*erkannt wird; nicht unterstützte oder nicht erkannte Dateien schlagen fehl, bevor der Provider aufgerufen wird. model run --fileist am besten geeignet, wenn Sie das ausgewählte multimodale Textmodell direkt testen möchten. Verwenden Sieinfer image describe, wenn Sie OpenClaws Provider-Auswahl für Bildverständnis und das Standardrouting für Bildmodelle nutzen möchten.- Das ausgewählte Modell muss Bildeingaben unterstützen; reine Textmodelle können die Anfrage auf Provider-Ebene ablehnen.
model run --promptmuss Text enthalten, der nicht nur aus Leerraum besteht; leere Prompts werden abgelehnt, bevor lokale Provider oder der Gateway aufgerufen werden.- Lokales
model runbeendet sich mit einem Exitcode ungleich null, wenn der Provider keine Textausgabe zurückgibt, sodass nicht erreichbare lokale Provider und leere Completions nicht wie erfolgreiche Probes aussehen. - Verwenden Sie
model run --gateway, wenn Sie Gateway-Routing, Agent-Laufzeit-Setup oder Gateway-verwalteten Provider-Zustand testen müssen, während die Modelleingabe roh bleibt. Verwenden Sieopenclaw agentoder Chat-Oberflächen, wenn Sie den vollständigen Agentenkontext, Tools, Memory und Sitzungstranskript benötigen. model auth login,model auth logoutundmodel auth statusverwalten den gespeicherten Provider-Authentifizierungszustand.
Bild
Verwenden Sieimage für Generierung, Bearbeitung und Beschreibung.
-
Verwenden Sie
image edit, wenn Sie mit vorhandenen Eingabedateien beginnen. -
Verwenden Sie
--size,--aspect-ratiooder--resolutionmitimage editfür Provider/Modelle, die Geometriehinweise bei Bearbeitungen von Referenzbildern unterstützen. -
Verwenden Sie
--output-format png --background transparentmit--model openai/gpt-image-1.5für OpenAI-PNG-Ausgaben mit transparentem Hintergrund;--openai-backgroundbleibt als OpenAI-spezifischer Alias verfügbar. Provider, die keine Hintergrundunterstützung deklarieren, melden den Hinweis als ignorierte Überschreibung. -
Verwenden Sie
image providers --json, um zu prüfen, welche gebündelten Bild-Provider auffindbar, konfiguriert und ausgewählt sind und welche Generierungs-/Bearbeitungsfunktionen jeder Provider bereitstellt. -
Verwenden Sie
image generate --model <provider/model> --jsonals engsten Live- CLI-Smoke-Test für Änderungen an der Bildgenerierung. Beispiel:Die JSON-Antwort meldetok,provider,model,attemptsund geschriebene Ausgabepfade. Wenn--outputgesetzt ist, kann die finale Erweiterung dem vom Provider zurückgegebenen MIME-Typ folgen. -
Verwenden Sie für
image describeundimage describe-many--prompt, um dem Vision-Modell eine aufgabenspezifische Anweisung wie OCR, Vergleich, UI-Prüfung oder knappe Bildbeschreibung zu geben. -
Verwenden Sie
--timeout-msbei langsamen lokalen Vision-Modellen oder Kaltstarts von Ollama. -
Für
image describemuss--modelein bildfähiges<provider/model>sein. -
Für lokale Ollama-Vision-Modelle laden Sie zuerst das Modell herunter und setzen
OLLAMA_API_KEYauf einen beliebigen Platzhalterwert, zum Beispielollama-local. Siehe Ollama.
Audio
Verwenden Sieaudio für Dateitranskription.
audio transcribeist für Dateitranskription gedacht, nicht für die Verwaltung von Echtzeitsitzungen.--modelmuss<provider/model>sein.
TTS
Verwenden Sietts für Sprachsynthese und den TTS-Provider-Status.
tts statusverwendet standardmäßig den Gateway, weil der Befehl den vom Gateway verwalteten TTS-Status widerspiegelt.- Verwenden Sie
tts providers,tts voicesundtts set-provider, um TTS-Verhalten zu prüfen und zu konfigurieren.
Video
Verwenden Sievideo für Generierung und Beschreibung.
video generateakzeptiert--size,--aspect-ratio,--resolution,--duration,--audio,--watermarkund--timeout-msund leitet sie an die Laufzeit für Videogenerierung weiter.--modelmuss fürvideo describe<provider/model>sein.
Web
Verwenden Sieweb für Such- und Abrufworkflows.
- Verwenden Sie
web providers, um verfügbare, konfigurierte und ausgewählte Provider zu prüfen.
Embedding
Verwenden Sieembedding für Vektorerstellung und Prüfung von Embedding-Providern.
JSON-Ausgabe
Infer-Befehle normalisieren JSON-Ausgaben unter einer gemeinsamen Hülle:okcapabilitytransportprovidermodelattemptsoutputserror
outputs Dateien, die von OpenClaw geschrieben wurden. Verwenden Sie
path, mimeType, size und alle medienspezifischen Abmessungen in diesem Array
für Automatisierung, statt menschenlesbare Standardausgabe zu parsen.
Häufige Fallstricke
Hinweise
openclaw capability ...ist ein Alias füropenclaw infer ....