Documentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
openclaw infer é a superfície headless canônica para fluxos de trabalho de inferência respaldados por provedores.
Ele expõe intencionalmente famílias de capacidades, não nomes RPC brutos do Gateway nem ids brutos de ferramentas de agente.
Transforme infer em uma skill
Copie e cole isto em um agente:- mapear intenções comuns do usuário para o subcomando infer correto
- incluir alguns exemplos canônicos de infer para os fluxos de trabalho que ela cobre
- preferir
openclaw infer ...em exemplos e sugestões - evitar documentar novamente toda a superfície de infer dentro do corpo da skill
openclaw infer model runopenclaw infer image generateopenclaw infer audio transcribeopenclaw infer tts convertopenclaw infer web searchopenclaw infer embedding create
Por que usar infer
openclaw infer fornece uma CLI consistente para tarefas de inferência respaldadas por provedores dentro do OpenClaw.
Benefícios:
- Use os provedores e modelos já configurados no OpenClaw em vez de conectar wrappers pontuais para cada backend.
- Mantenha fluxos de trabalho de modelo, imagem, transcrição de áudio, TTS, vídeo, web e embeddings sob uma única árvore de comandos.
- Use um formato de saída
--jsonestável para scripts, automação e fluxos de trabalho conduzidos por agentes. - Prefira uma superfície primária do OpenClaw quando a tarefa for fundamentalmente “executar inferência”.
- Use o caminho local normal sem exigir o Gateway para a maioria dos comandos infer.
openclaw infer ... depois que os testes de provedor de nível mais baixo
estiverem verdes. Ele exercita a CLI entregue, o carregamento de configuração,
a resolução de agente padrão, a ativação de Plugin integrado e o runtime compartilhado
de capacidades antes que a solicitação ao provedor seja feita.
Árvore de comandos
Tarefas comuns
Esta tabela mapeia tarefas comuns de inferência para o comando infer correspondente.| Tarefa | Comando | Observações |
|---|---|---|
| Executar um prompt de texto/modelo | openclaw infer model run --prompt "..." --json | Usa o caminho local normal por padrão |
| Executar um prompt de modelo em imagens | openclaw infer model run --prompt "Describe this" --file ./image.png --model provider/model | Repita --file para várias entradas de imagem |
| Gerar uma imagem | openclaw infer image generate --prompt "..." --json | Use image edit ao começar de um arquivo existente |
| Descrever um arquivo de imagem | openclaw infer image describe --file ./image.png --prompt "..." --json | --model deve ser um <provider/model> compatível com imagem |
| Transcrever áudio | openclaw infer audio transcribe --file ./memo.m4a --json | --model deve ser <provider/model> |
| Sintetizar fala | openclaw infer tts convert --text "..." --output ./speech.mp3 --json | tts status é orientado ao Gateway |
| Gerar um vídeo | openclaw infer video generate --prompt "..." --json | Aceita dicas de provedor como --resolution |
| Descrever um arquivo de vídeo | openclaw infer video describe --file ./clip.mp4 --json | --model deve ser <provider/model> |
| Pesquisar na web | openclaw infer web search --query "..." --json | |
| Buscar uma página da web | openclaw infer web fetch --url https://example.com --json | |
| Criar embeddings | openclaw infer embedding create --text "..." --json |
Comportamento
openclaw infer ...é a superfície de CLI principal para estes fluxos de trabalho.- Use
--jsonquando a saída for consumida por outro comando ou script. - Use
--providerou--model provider/modelquando um backend específico for necessário. - Use
model run --thinking <level>para passar um nível pontual de pensamento/raciocínio (off,minimal,low,medium,high,adaptive,xhighoumax) mantendo a execução bruta. - Para
image describe,audio transcribeevideo describe,--modeldeve usar o formato<provider/model>. - Para
image describe, um--modelexplícito executa esse provedor/modelo diretamente. O modelo deve ser compatível com imagem no catálogo de modelos ou na configuração do provedor.codex/<model>executa um turno delimitado de compreensão de imagem do servidor de app Codex;openai-codex/<model>usa o caminho do provedor OAuth do OpenAI Codex. - Comandos de execução sem estado usam local por padrão.
- Comandos de estado gerenciados pelo Gateway usam Gateway por padrão.
- O caminho local normal não exige que o Gateway esteja em execução.
model runlocal é uma conclusão pontual enxuta de provedor. Ele resolve o modelo e a autenticação do agente configurado, mas não inicia um turno de agente de chat, carrega ferramentas nem abre servidores MCP integrados.model run --fileaceita arquivos de imagem, detecta seu tipo MIME e os envia com o prompt fornecido ao modelo selecionado. Repita--filepara várias imagens.model run --filerejeita entradas que não sejam imagens. Useinfer audio transcribepara arquivos de áudio einfer video describepara arquivos de vídeo.model run --gatewayexercita o roteamento do Gateway, a autenticação salva, a seleção de provedor e o runtime incorporado, mas ainda executa como uma sondagem bruta de modelo: ele envia o prompt fornecido e quaisquer anexos de imagem sem transcrição de sessão anterior, contexto bootstrap/AGENTS, montagem do mecanismo de contexto, ferramentas ou servidores MCP integrados.model run --gateway --model <provider/model>exige uma credencial de Gateway de operador confiável porque a solicitação pede ao Gateway para executar uma substituição pontual de provedor/modelo.model run --thinkinglocal usa o caminho enxuto de conclusão de provedor; níveis específicos de provedor comoadaptiveemaxsão mapeados para o nível portátil de conclusão simples mais próximo.
Modelo
Usemodel para inferência de texto respaldada por provedor e inspeção de modelo/provedor.
<provider/model> para fazer smoke-test de um provedor específico sem
iniciar o Gateway nem carregar toda a superfície de ferramentas do agente:
model runlocal é o smoke de CLI mais estreito para a saúde de provedor/modelo/autenticação porque, para provedores que não são Codex, ele envia somente o prompt fornecido ao modelo selecionado.model run --model <provider/model>local pode usar linhas exatas do catálogo estático integrado demodels list --allantes que esse provedor seja gravado na configuração. A autenticação do provedor ainda é necessária; credenciais ausentes falham como erros de autenticação, nãoUnknown model.- Para sondagens de raciocínio do Mistral Medium 3.5, deixe a temperatura não definida/padrão. O Mistral rejeita
reasoning_effort="high"maistemperature: 0; usemistral/mistral-medium-3-5com a temperatura padrão ou um valor de modo de raciocínio diferente de zero, como0.7. - Sondagens locais
openai-codex/*são a exceção estreita: o OpenClaw adiciona uma instrução mínima de sistema para que o transporte Codex Responses possa preencher seu campo obrigatórioinstructions, sem adicionar contexto completo de agente, ferramentas, memória ou transcrição de sessão. model run --filelocal mantém esse caminho enxuto e anexa o conteúdo de imagem diretamente à única mensagem do usuário. Arquivos de imagem comuns como PNG, JPEG e WebP funcionam quando seu tipo MIME é detectado comoimage/*; arquivos sem suporte ou não reconhecidos falham antes de o provedor ser chamado.model run --fileé melhor quando você quer testar diretamente o modelo de texto multimodal selecionado. Useinfer image describequando quiser a seleção de provedor de compreensão de imagem do OpenClaw e o roteamento padrão de modelo de imagem.- O modelo selecionado deve aceitar entrada de imagem; modelos somente texto podem rejeitar a solicitação na camada do provedor.
model run --promptdeve conter texto que não seja apenas espaço em branco; prompts vazios são rejeitados antes que provedores locais ou o Gateway sejam chamados.model runlocal sai com código diferente de zero quando o provedor não retorna saída de texto, para que provedores locais inalcançáveis e conclusões vazias não pareçam sondagens bem-sucedidas.- Use
model run --gatewayquando precisar testar o roteamento do Gateway, a configuração do runtime de agente ou o estado de provedor gerenciado pelo Gateway mantendo a entrada do modelo bruta. Useopenclaw agentou superfícies de chat quando quiser o contexto completo do agente, ferramentas, memória e transcrição de sessão. model auth login,model auth logoutemodel auth statusgerenciam o estado de autenticação de provedor salvo.
Imagem
Useimage para geração, edição e descrição.
-
Use
image editao começar a partir de arquivos de entrada existentes. -
Use
--size,--aspect-ratioou--resolutioncomimage editpara provedores/modelos que aceitam dicas de geometria em edições de imagens de referência. -
Use
--output-format png --background transparentcom--model openai/gpt-image-1.5para saída PNG da OpenAI com fundo transparente;--openai-backgroundcontinua disponível como um alias específico da OpenAI. Provedores que não declaram suporte a fundo relatam a dica como uma substituição ignorada. -
Use
image providers --jsonpara verificar quais provedores de imagem integrados são detectáveis, configurados, selecionados e quais capacidades de geração/edição cada provedor expõe. -
Use
image generate --model <provider/model> --jsoncomo o teste de fumaça de CLI ao vivo mais restrito para alterações de geração de imagens. Exemplo:A resposta JSON relataok,provider,model,attemptse caminhos de saída gravados. Quando--outputestá definido, a extensão final pode seguir o tipo MIME retornado pelo provedor. -
Para
image describeeimage describe-many, use--promptpara dar ao modelo de visão uma instrução específica da tarefa, como OCR, comparação, inspeção de UI ou legenda concisa. -
Use
--timeout-mscom modelos locais de visão lentos ou inicializações frias do Ollama. -
Para
image describe,--modeldeve ser um<provider/model>compatível com imagem. -
Para modelos locais de visão do Ollama, baixe o modelo primeiro e defina
OLLAMA_API_KEYcomo qualquer valor de placeholder, por exemploollama-local. Consulte Ollama.
Áudio
Useaudio para transcrição de arquivos.
audio transcribeé para transcrição de arquivos, não para gerenciamento de sessões em tempo real.--modeldeve ser<provider/model>.
TTS
Usetts para síntese de fala e estado do provedor de TTS.
tts statususa Gateway por padrão porque reflete o estado de TTS gerenciado pelo Gateway.- Use
tts providers,tts voicesetts set-providerpara inspecionar e configurar o comportamento de TTS.
Vídeo
Usevideo para geração e descrição.
video generateaceita--size,--aspect-ratio,--resolution,--duration,--audio,--watermarke--timeout-mse os encaminha para o runtime de geração de vídeo.--modeldeve ser<provider/model>paravideo describe.
Web
Useweb para fluxos de trabalho de busca e obtenção.
- Use
web providerspara inspecionar provedores disponíveis, configurados e selecionados.
Embedding
Useembedding para criação de vetores e inspeção de provedores de embeddings.
Saída JSON
Os comandos de inferência normalizam a saída JSON em um envelope compartilhado:okcapabilitytransportprovidermodelattemptsoutputserror
outputs contém arquivos gravados pelo OpenClaw. Use
path, mimeType, size e quaisquer dimensões específicas de mídia nesse array
para automação, em vez de analisar stdout legível por humanos.
Armadilhas comuns
Observações
openclaw capability ...é um alias paraopenclaw infer ....