Documentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
openclaw infer 是由提供商支持的推理工作流的规范无头界面。
它有意暴露能力族,而不是原始 Gateway 网关 RPC 名称,也不是原始智能体工具 ID。
将 infer 转为一个 Skills
将此内容复制并粘贴给智能体:- 将常见用户意图映射到正确的 infer 子命令
- 为它覆盖的工作流包含几个规范 infer 示例
- 在示例和建议中优先使用
openclaw infer ... - 避免在 Skills 正文中重新记录整个 infer 界面
openclaw infer model runopenclaw infer image generateopenclaw infer audio transcribeopenclaw infer tts convertopenclaw infer web searchopenclaw infer embedding create
为什么使用 infer
openclaw infer 为 OpenClaw 内由提供商支持的推理任务提供一个一致的 CLI。
优势:
- 使用 OpenClaw 中已配置的提供商和模型,而不是为每个后端接入一次性包装器。
- 将模型、图像、音频转写、TTS、视频、Web 和嵌入工作流放在同一个命令树下。
- 为脚本、自动化和智能体驱动的工作流使用稳定的
--json输出形状。 - 当任务本质上是“运行推理”时,优先使用 OpenClaw 第一方界面。
- 对于大多数 infer 命令,使用常规本地路径而不需要 Gateway 网关。
openclaw infer ...。它会在发起提供商请求之前,
覆盖已发布的 CLI、配置加载、
默认智能体解析、内置插件激活,以及共享能力
运行时。
命令树
常见任务
此表将常见推理任务映射到对应的 infer 命令。| 任务 | 命令 | 备注 |
|---|---|---|
| 运行文本/模型提示词 | openclaw infer model run --prompt "..." --json | 默认使用常规本地路径 |
| 在图像上运行模型提示词 | openclaw infer model run --prompt "Describe this" --file ./image.png --model provider/model | 对多个图像输入重复使用 --file |
| 生成图像 | openclaw infer image generate --prompt "..." --json | 从现有文件开始时使用 image edit |
| 描述图像文件 | openclaw infer image describe --file ./image.png --prompt "..." --json | --model 必须是支持图像的 <provider/model> |
| 转写音频 | openclaw infer audio transcribe --file ./memo.m4a --json | --model 必须是 <provider/model> |
| 合成语音 | openclaw infer tts convert --text "..." --output ./speech.mp3 --json | tts status 面向 Gateway 网关 |
| 生成视频 | openclaw infer video generate --prompt "..." --json | 支持 --resolution 等提供商提示 |
| 描述视频文件 | openclaw infer video describe --file ./clip.mp4 --json | --model 必须是 <provider/model> |
| 搜索 Web | openclaw infer web search --query "..." --json | |
| 获取 Web 页面 | openclaw infer web fetch --url https://example.com --json | |
| 创建嵌入 | openclaw infer embedding create --text "..." --json |
行为
openclaw infer ...是这些工作流的主要 CLI 界面。- 当输出会被另一个命令或脚本消费时,使用
--json。 - 当需要特定后端时,使用
--provider或--model provider/model。 - 使用
model run --thinking <level>传递一次性思考/推理级别(off、minimal、low、medium、high、adaptive、xhigh或max),同时保持运行原始。 - 对于
image describe、audio transcribe和video describe,--model必须使用<provider/model>形式。 - 对于
image describe,显式--model会直接运行该提供商/模型。该模型必须在模型目录或提供商配置中支持图像。codex/<model>会运行一个有边界的 Codex 应用服务器图像理解轮次;openai-codex/<model>使用 OpenAI Codex OAuth 提供商路径。 - 无状态执行命令默认使用本地。
- Gateway 网关管理的状态命令默认使用 Gateway 网关。
- 常规本地路径不需要 Gateway 网关正在运行。
- 本地
model run是一个轻量级的一次性提供商补全。它会解析已配置的智能体模型和凭证,但不会启动聊天智能体轮次、加载工具,也不会打开内置 MCP 服务器。 model run --file接受图像文件,检测其 MIME 类型,并将它们随提供的提示词发送给所选模型。对多个图像重复使用--file。model run --file会拒绝非图像输入。对音频文件使用infer audio transcribe,对视频文件使用infer video describe。model run --gateway会覆盖 Gateway 网关路由、已保存凭证、提供商选择和嵌入式运行时,但仍作为原始模型探测运行:它会发送提供的提示词和任何图像附件,不包含之前的会话转录、bootstrap/AGENTS 上下文、上下文引擎装配、工具或内置 MCP 服务器。model run --gateway --model <provider/model>需要受信任的操作员 Gateway 网关凭据,因为该请求要求 Gateway 网关运行一次性提供商/模型覆盖。- 本地
model run --thinking使用轻量提供商补全路径;adaptive和max等提供商特定级别会映射到最接近的可移植简单补全级别。
模型
使用model 进行由提供商支持的文本推理,以及模型/提供商检查。
<provider/model> 引用对特定提供商进行冒烟测试,而无需
启动 Gateway 网关或加载完整智能体工具界面:
- 本地
model run是用于检查提供商/模型/凭证健康状态的最窄 CLI 冒烟测试,因为对于非 Codex 提供商,它只会将提供的提示词发送给所选模型。 - 本地
model run --model <provider/model>可以在该提供商写入配置之前,使用来自models list --all的精确内置静态目录行。仍然需要提供商凭证;缺少凭据会作为凭证错误失败,而不是Unknown model。 - 对于 Mistral Medium 3.5 推理探测,保持 temperature 未设置/默认。Mistral 会拒绝
reasoning_effort="high"加temperature: 0;请使用默认 temperature 的mistral/mistral-medium-3-5,或使用非零推理模式值,例如0.7。 openai-codex/*本地探测是一个狭窄例外:OpenClaw 会添加最小系统指令,以便 Codex Responses 传输可以填充其必需的instructions字段,而不会添加完整智能体上下文、工具、记忆或会话转录。- 本地
model run --file保持该轻量路径,并将图像内容直接附加到单个用户消息。PNG、JPEG 和 WebP 等常见图像文件在其 MIME 类型被检测为image/*时可用;不支持或无法识别的文件会在调用提供商之前失败。 - 当你想直接测试所选多模态文本模型时,
model run --file最合适。当你想使用 OpenClaw 的图像理解提供商选择和默认图像模型路由时,使用infer image describe。 - 所选模型必须支持图像输入;纯文本模型可能会在提供商层拒绝请求。
model run --prompt必须包含非空白文本;空提示词会在调用本地提供商或 Gateway 网关之前被拒绝。- 当提供商未返回文本输出时,本地
model run会以非零状态退出,因此不可达的本地提供商和空补全不会看起来像成功探测。 - 当你需要测试 Gateway 网关路由、智能体运行时设置或 Gateway 网关管理的提供商状态,同时保持模型输入原始时,使用
model run --gateway。当你需要完整智能体上下文、工具、记忆和会话转录时,使用openclaw agent或聊天界面。 model auth login、model auth logout和model auth status管理已保存的提供商凭证状态。
图像
使用image 进行生成、编辑和描述。
-
从现有输入文件开始时,使用
image edit。 -
对于支持在参考图像编辑中使用几何提示的提供商/模型,请将
--size、--aspect-ratio或--resolution与image edit搭配使用。 -
对透明背景的 OpenAI PNG 输出,请将
--output-format png --background transparent与--model openai/gpt-image-1.5搭配使用;--openai-background仍可作为 OpenAI 专用别名使用。未声明支持背景的提供商会将该提示报告为已忽略的覆盖项。 -
使用
image providers --json验证哪些内置图像提供商可发现、已配置、已选中,以及每个提供商公开了哪些生成/编辑能力。 -
使用
image generate --model <provider/model> --json作为图像生成变更的最小范围实时 CLI 冒烟测试。示例:JSON 响应会报告ok、provider、model、attempts和已写入的输出路径。设置--output时,最终扩展名可能会遵循提供商返回的 MIME 类型。 -
对于
image describe和image describe-many,使用--prompt为视觉模型提供任务特定指令,例如 OCR、比较、UI 检查或简短图注。 -
对较慢的本地视觉模型或冷启动的 Ollama 使用
--timeout-ms。 -
对于
image describe,--model必须是支持图像的<provider/model>。 -
对于本地 Ollama 视觉模型,请先拉取模型,并将
OLLAMA_API_KEY设置为任意占位值,例如ollama-local。请参阅 Ollama。
音频
使用audio 进行文件转写。
audio transcribe用于文件转写,而不是实时会话管理。--model必须是<provider/model>。
TTS
使用tts 进行语音合成和 TTS 提供商状态查看。
tts status默认使用 Gateway 网关,因为它反映 Gateway 网关管理的 TTS 状态。- 使用
tts providers、tts voices和tts set-provider检查和配置 TTS 行为。
视频
使用video 进行生成和描述。
video generate接受--size、--aspect-ratio、--resolution、--duration、--audio、--watermark和--timeout-ms,并将它们转发给视频生成运行时。- 对于
video describe,--model必须是<provider/model>。
Web
使用web 进行搜索和抓取工作流。
- 使用
web providers检查可用、已配置和已选中的提供商。
嵌入
使用embedding 创建向量并检查嵌入提供商。
JSON 输出
Infer 命令会在共享封套下规范化 JSON 输出:okcapabilitytransportprovidermodelattemptsoutputserror
outputs 包含 OpenClaw 写入的文件。自动化时,请使用该数组中的 path、mimeType、size 和任何媒体特定尺寸,而不是解析面向人类的 stdout。
常见陷阱
注意
openclaw capability ...是openclaw infer ...的别名。