Documentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
openclaw infer è l’interfaccia headless canonica per i flussi di lavoro di inferenza supportati da provider.
Espone intenzionalmente famiglie di capacità, non nomi RPC grezzi del Gateway e non id grezzi degli strumenti dell’agente.
Trasforma infer in una skill
Copia e incolla questo in un agente:- mappare gli intenti comuni dell’utente al sottocomando infer corretto
- includere alcuni esempi canonici di infer per i flussi di lavoro coperti
- preferire
openclaw infer ...negli esempi e nei suggerimenti - evitare di documentare di nuovo l’intera superficie di infer nel corpo della skill
openclaw infer model runopenclaw infer image generateopenclaw infer audio transcribeopenclaw infer tts convertopenclaw infer web searchopenclaw infer embedding create
Perché usare infer
openclaw infer fornisce una CLI coerente per le attività di inferenza supportate da provider all’interno di OpenClaw.
Vantaggi:
- Usa i provider e i modelli già configurati in OpenClaw invece di collegare wrapper una tantum per ogni backend.
- Mantieni i flussi di lavoro per modelli, immagini, trascrizione audio, TTS, video, web ed embedding sotto un unico albero di comandi.
- Usa una forma di output
--jsonstabile per script, automazione e flussi di lavoro guidati da agenti. - Preferisci una superficie OpenClaw proprietaria quando l’attività è fondamentalmente “eseguire inferenza”.
- Usa il normale percorso locale senza richiedere il Gateway per la maggior parte dei comandi infer.
openclaw infer ... una volta che i test
provider di livello inferiore sono verdi. Esercita la CLI distribuita, il caricamento della configurazione,
la risoluzione dell’agente predefinito, l’attivazione dei plugin in bundle e il runtime delle capacità
condivise prima che venga effettuata la richiesta al provider.
Albero dei comandi
Attività comuni
Questa tabella mappa le attività di inferenza comuni al comando infer corrispondente.| Attività | Comando | Note |
|---|---|---|
| Eseguire un prompt testuale/modello | openclaw infer model run --prompt "..." --json | Usa il normale percorso locale per impostazione predefinita |
| Eseguire un prompt modello su immagini | openclaw infer model run --prompt "Describe this" --file ./image.png --model provider/model | Ripeti --file per più input immagine |
| Generare un’immagine | openclaw infer image generate --prompt "..." --json | Usa image edit quando parti da un file esistente |
| Descrivere un file immagine | openclaw infer image describe --file ./image.png --prompt "..." --json | --model deve essere un <provider/model> compatibile con le immagini |
| Trascrivere audio | openclaw infer audio transcribe --file ./memo.m4a --json | --model deve essere <provider/model> |
| Sintetizzare parlato | openclaw infer tts convert --text "..." --output ./speech.mp3 --json | tts status è orientato al Gateway |
| Generare un video | openclaw infer video generate --prompt "..." --json | Supporta suggerimenti del provider come --resolution |
| Descrivere un file video | openclaw infer video describe --file ./clip.mp4 --json | --model deve essere <provider/model> |
| Cercare sul web | openclaw infer web search --query "..." --json | |
| Recuperare una pagina web | openclaw infer web fetch --url https://example.com --json | |
| Creare embedding | openclaw infer embedding create --text "..." --json |
Comportamento
openclaw infer ...è la superficie CLI primaria per questi flussi di lavoro.- Usa
--jsonquando l’output sarà consumato da un altro comando o script. - Usa
--providero--model provider/modelquando è richiesto un backend specifico. - Usa
model run --thinking <level>per passare un livello di pensiero/ragionamento una tantum (off,minimal,low,medium,high,adaptive,xhighomax) mantenendo l’esecuzione grezza. - Per
image describe,audio transcribeevideo describe,--modeldeve usare la forma<provider/model>. - Per
image describe, un--modelesplicito esegue direttamente quel provider/modello. Il modello deve supportare immagini nel catalogo modelli o nella configurazione del provider.codex/<model>esegue un turno limitato di comprensione immagini del server app Codex;openai-codex/<model>usa il percorso del provider OAuth OpenAI Codex. - I comandi di esecuzione senza stato usano il locale per impostazione predefinita.
- I comandi di stato gestiti dal Gateway usano il Gateway per impostazione predefinita.
- Il normale percorso locale non richiede che il Gateway sia in esecuzione.
model runlocale è un completamento provider snello e one-shot. Risolve il modello e l’autenticazione dell’agente configurati, ma non avvia un turno di chat-agent, non carica strumenti e non apre server MCP in bundle.model run --fileaccetta file immagine, ne rileva il tipo MIME e li invia con il prompt fornito al modello selezionato. Ripeti--fileper più immagini.model run --filerifiuta input non immagine. Usainfer audio transcribeper i file audio einfer video describeper i file video.model run --gatewayesercita l’instradamento del Gateway, l’autenticazione salvata, la selezione del provider e il runtime incorporato, ma viene comunque eseguito come probe modello grezzo: invia il prompt fornito e gli eventuali allegati immagine senza trascrizione di sessione precedente, contesto bootstrap/AGENTS, assemblaggio context-engine, strumenti o server MCP in bundle.model run --gateway --model <provider/model>richiede una credenziale Gateway di operatore attendibile perché la richiesta chiede al Gateway di eseguire un override provider/modello una tantum.model run --thinkinglocale usa il percorso snello di completamento provider; livelli specifici del provider comeadaptiveemaxvengono mappati al livello di completamento semplice portabile più vicino.
Modello
Usamodel per l’inferenza testuale supportata da provider e per l’ispezione di modelli/provider.
<provider/model> per eseguire uno smoke test su un provider specifico senza
avviare il Gateway o caricare l’intera superficie degli strumenti dell’agente:
model runlocale è lo smoke CLI più ristretto per la salute di provider/modello/autenticazione perché, per provider non Codex, invia solo il prompt fornito al modello selezionato.model run --model <provider/model>locale può usare righe esatte del catalogo statico in bundle damodels list --allprima che quel provider venga scritto nella configurazione. L’autenticazione del provider è comunque richiesta; credenziali mancanti generano errori di autenticazione, nonUnknown model.- Per probe di ragionamento Mistral Medium 3.5, lascia temperature non impostato/predefinito. Mistral rifiuta
reasoning_effort="high"piùtemperature: 0; usamistral/mistral-medium-3-5con temperature predefinito o un valore di modalità ragionamento non zero come0.7. - I probe locali
openai-codex/*sono l’eccezione ristretta: OpenClaw aggiunge un’istruzione di sistema minima affinché il trasporto Codex Responses possa popolare il campoinstructionsrichiesto, senza aggiungere il contesto completo dell’agente, strumenti, memoria o trascrizione di sessione. model run --filelocale mantiene quel percorso snello e allega il contenuto immagine direttamente al singolo messaggio utente. File immagine comuni come PNG, JPEG e WebP funzionano quando il loro tipo MIME viene rilevato comeimage/*; file non supportati o non riconosciuti falliscono prima che il provider venga chiamato.model run --fileè ideale quando vuoi testare direttamente il modello testuale multimodale selezionato. Usainfer image describequando vuoi la selezione provider di comprensione immagini di OpenClaw e l’instradamento predefinito del modello immagine.- Il modello selezionato deve supportare input immagine; i modelli solo testo possono rifiutare la richiesta al livello del provider.
model run --promptdeve contenere testo non composto solo da spazi; i prompt vuoti vengono rifiutati prima che vengano chiamati i provider locali o il Gateway.model runlocale termina con codice diverso da zero quando il provider non restituisce output testuale, quindi provider locali non raggiungibili e completamenti vuoti non sembrano probe riusciti.- Usa
model run --gatewayquando devi testare l’instradamento del Gateway, la configurazione agent-runtime o lo stato provider gestito dal Gateway mantenendo grezzo l’input del modello. Usaopenclaw agento superfici di chat quando vuoi il contesto completo dell’agente, strumenti, memoria e trascrizione di sessione. model auth login,model auth logoutemodel auth statusgestiscono lo stato di autenticazione del provider salvato.
Immagine
Usaimage per generazione, modifica e descrizione.
-
Usa
image editquando parti da file di input esistenti. -
Usa
--size,--aspect-ratioo--resolutionconimage editper provider/modelli che supportano suggerimenti geometrici nelle modifiche con immagini di riferimento. -
Usa
--output-format png --background transparentcon--model openai/gpt-image-1.5per l’output PNG OpenAI con sfondo trasparente;--openai-backgroundrimane disponibile come alias specifico di OpenAI. I provider che non dichiarano il supporto dello sfondo segnalano il suggerimento come override ignorato. -
Usa
image providers --jsonper verificare quali provider di immagini inclusi sono individuabili, configurati, selezionati e quali funzionalità di generazione/modifica espone ogni provider. -
Usa
image generate --model <provider/model> --jsoncome smoke live CLI più mirato per le modifiche alla generazione di immagini. Esempio:La risposta JSON riportaok,provider,model,attemptse i percorsi di output scritti. Quando--outputè impostato, l’estensione finale può seguire il tipo MIME restituito dal provider. -
Per
image describeeimage describe-many, usa--promptper dare al modello di visione un’istruzione specifica per l’attività, come OCR, confronto, ispezione dell’interfaccia utente o didascalia concisa. -
Usa
--timeout-mscon modelli di visione locali lenti o avvii a freddo di Ollama. -
Per
image describe,--modeldeve essere un<provider/model>con supporto per immagini. -
Per i modelli di visione locali Ollama, scarica prima il modello e imposta
OLLAMA_API_KEYsu un qualsiasi valore segnaposto, ad esempioollama-local. Vedi Ollama.
Audio
Usaaudio per la trascrizione di file.
audio transcribeserve per la trascrizione di file, non per la gestione di sessioni in tempo reale.--modeldeve essere<provider/model>.
TTS
Usatts per la sintesi vocale e lo stato del provider TTS.
tts statususa Gateway per impostazione predefinita perché riflette lo stato TTS gestito da Gateway.- Usa
tts providers,tts voicesetts set-providerper ispezionare e configurare il comportamento TTS.
Video
Usavideo per la generazione e la descrizione.
video generateaccetta--size,--aspect-ratio,--resolution,--duration,--audio,--watermarke--timeout-mse li inoltra al runtime di generazione video.--modeldeve essere<provider/model>pervideo describe.
Web
Usaweb per i flussi di lavoro di ricerca e recupero.
- Usa
web providersper ispezionare i provider disponibili, configurati e selezionati.
Embedding
Usaembedding per la creazione di vettori e l’ispezione dei provider di embedding.
Output JSON
I comandi infer normalizzano l’output JSON in un contenitore condiviso:okcapabilitytransportprovidermodelattemptsoutputserror
outputs contiene i file scritti da OpenClaw. Usa
path, mimeType, size ed eventuali dimensioni specifiche del media in quell’array
per l’automazione invece di analizzare lo stdout leggibile dall’uomo.
Problemi comuni
Note
openclaw capability ...è un alias diopenclaw infer ....