Skip to main content

Documentation Index

Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt

Use this file to discover all available pages before exploring further.

如需快速开始、QA 运行器、单元/集成测试套件和 Docker 流程,请参见 测试。本页介绍 live(会访问网络的)测试 套件:模型矩阵、CLI 后端、ACP、媒体提供商 live 测试,以及凭证处理。

Live:本地 profile 冒烟命令

在临时 live 检查前 source ~/.profile,确保提供商密钥和本地工具 路径与你的 shell 匹配:
source ~/.profile
安全媒体冒烟测试:
pnpm openclaw infer tts convert --local --json \
  --text "OpenClaw live smoke." \
  --output /tmp/openclaw-live-smoke.mp3
安全语音通话就绪冒烟测试:
pnpm openclaw voicecall setup --json
pnpm openclaw voicecall smoke --to "+15555550123"
除非同时提供 --yes,否则 voicecall smoke 是 dry run。仅当你明确想要发起真实通知通话时才使用 --yes。对于 Twilio、Telnyx 和 Plivo,成功的就绪检查需要一个公开 webhook URL;local loopback 或私有回退会按设计被拒绝。

Live:Android 节点能力扫描

  • 测试:src/gateway/android-node.capabilities.live.test.ts
  • 脚本:pnpm android:test:integration
  • 目标:调用已连接 Android 节点当前公开的每个命令,并断言命令契约行为。
  • 范围:
    • 需要预先准备/手动设置(该套件不会安装、运行或配对应用)。
    • 对所选 Android 节点逐个命令进行 Gateway 网关 node.invoke 验证。
  • 必需的预设置:
    • Android 应用已连接并配对到 Gateway 网关。
    • 应用保持在前台。
    • 已为你预期通过的能力授予权限/采集同意。
  • 可选目标覆盖:
    • OPENCLAW_ANDROID_NODE_IDOPENCLAW_ANDROID_NODE_NAME
    • OPENCLAW_ANDROID_GATEWAY_URL / OPENCLAW_ANDROID_GATEWAY_TOKEN / OPENCLAW_ANDROID_GATEWAY_PASSWORD
  • 完整 Android 设置详情:Android 应用

Live:模型冒烟(profile 密钥)

Live 测试拆分为两层,以便隔离故障:
  • “直接模型”用于确认提供商/模型是否能用给定密钥正常回答。
  • “Gateway 网关冒烟”用于确认该模型的完整 Gateway 网关 + 智能体管线是否正常工作(会话、历史、工具、沙箱策略等)。

第 1 层:直接模型补全(无 Gateway 网关)

  • 测试:src/agents/models.profiles.live.test.ts
  • 目标:
    • 枚举发现的模型
    • 使用 getApiKeyForModel 选择你有凭证的模型
    • 为每个模型运行一个小型补全(并在需要时运行定向回归)
  • 启用方式:
    • pnpm test:live(或在直接调用 Vitest 时使用 OPENCLAW_LIVE_TEST=1
  • 设置 OPENCLAW_LIVE_MODELS=modern(或 all,即 modern 的别名)才会实际运行此套件;否则它会跳过,以便让 pnpm test:live 聚焦于 Gateway 网关冒烟
  • 选择模型的方式:
    • OPENCLAW_LIVE_MODELS=modern 运行 modern 允许列表(Opus/Sonnet 4.6+、GPT-5.2 + Codex、Gemini 3、DeepSeek V4、GLM 4.7、MiniMax M2.7、Grok 4.3)
    • OPENCLAW_LIVE_MODELS=all 是 modern 允许列表的别名
    • OPENCLAW_LIVE_MODELS="openai/gpt-5.5,openai-codex/gpt-5.5,anthropic/claude-opus-4-6,..."(逗号分隔的允许列表)
    • Modern/all 扫描默认使用精心挑选的高信号上限;设置 OPENCLAW_LIVE_MAX_MODELS=0 进行完整 modern 扫描,或设置正数以使用更小上限。
    • 完整扫描使用 OPENCLAW_LIVE_TEST_TIMEOUT_MS 作为整个直接模型测试的超时时间。默认:60 分钟。
    • 直接模型探测默认以 20 路并行运行;设置 OPENCLAW_LIVE_MODEL_CONCURRENCY 可覆盖。
  • 选择提供商的方式:
    • OPENCLAW_LIVE_PROVIDERS="google,google-antigravity,google-gemini-cli"(逗号分隔的允许列表)
  • 密钥来源:
    • 默认:profile 存储和环境回退
    • 设置 OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1 强制仅使用 profile 存储
  • 存在原因:
    • 将“提供商 API 损坏/密钥无效”与“Gateway 网关智能体管线损坏”分离
    • 包含小型、隔离的回归(示例:OpenAI Responses/Codex Responses 推理回放 + 工具调用流程)

第 2 层:Gateway 网关 + dev 智能体冒烟(“@openclaw”实际执行的内容)

  • 测试:src/gateway/gateway-models.profiles.live.test.ts
  • 目标:
    • 启动一个进程内 Gateway 网关
    • 创建/修补一个 agent:dev:* 会话(每次运行覆盖模型)
    • 迭代带密钥的模型并断言:
      • “有意义的”响应(无工具)
      • 真实工具调用可工作(读取探测)
      • 可选额外工具探测(exec + 读取探测)
      • OpenAI 回归路径(仅工具调用 → 后续追问)保持可用
  • 探测详情(便于你快速解释故障):
    • read 探测:测试会在工作区写入一个 nonce 文件,并要求智能体 read 它且回显 nonce。
    • exec+read 探测:测试要求智能体通过 exec 将 nonce 写入临时文件,然后 read 回来。
    • 图像探测:测试附加生成的 PNG(cat + 随机代码),并期望模型返回 cat <CODE>
    • 实现参考:src/gateway/gateway-models.profiles.live.test.tssrc/gateway/live-image-probe.ts
  • 启用方式:
    • pnpm test:live(或在直接调用 Vitest 时使用 OPENCLAW_LIVE_TEST=1
  • 选择模型的方式:
    • 默认:modern 允许列表(Opus/Sonnet 4.6+、GPT-5.2 + Codex、Gemini 3、DeepSeek V4、GLM 4.7、MiniMax M2.7、Grok 4.3)
    • OPENCLAW_LIVE_GATEWAY_MODELS=all 是 modern 允许列表的别名
    • 或设置 OPENCLAW_LIVE_GATEWAY_MODELS="provider/model"(或逗号列表)来缩小范围
    • Modern/all Gateway 网关扫描默认使用精心挑选的高信号上限;设置 OPENCLAW_LIVE_GATEWAY_MAX_MODELS=0 进行完整 modern 扫描,或设置正数以使用更小上限。
  • 选择提供商的方式(避免“OpenRouter 全量”):
    • OPENCLAW_LIVE_GATEWAY_PROVIDERS="google,google-antigravity,google-gemini-cli,openai,anthropic,zai,minimax"(逗号分隔的允许列表)
  • 工具 + 图像探测在此 live 测试中始终开启:
    • read 探测 + exec+read 探测(工具压力)
    • 当模型声明支持图像输入时运行图像探测
    • 流程(高层):
      • 测试生成一个带有 “CAT” + 随机代码的小 PNG(src/gateway/live-image-probe.ts
      • 通过 agent attachments: [{ mimeType: "image/png", content: "<base64>" }] 发送
      • Gateway 网关将附件解析为 images[]src/gateway/server-methods/agent.ts + src/gateway/chat-attachments.ts
      • 嵌入式智能体将多模态用户消息转发给模型
      • 断言:回复包含 cat + 代码(OCR 容错:允许少量错误)
要查看你机器上可以测试的内容(以及精确的 provider/model ID),请运行:
openclaw models list
openclaw models list --json

Live:CLI 后端冒烟(Claude、Codex、Gemini 或其他本地 CLI)

  • 测试:src/gateway/gateway-cli-backend.live.test.ts
  • 目标:使用本地 CLI 后端验证 Gateway 网关 + 智能体管线,且不触碰你的默认配置。
  • 特定后端的冒烟默认值位于所属插件的 cli-backend.ts 定义中。
  • 启用:
    • pnpm test:live(或在直接调用 Vitest 时使用 OPENCLAW_LIVE_TEST=1
    • OPENCLAW_LIVE_CLI_BACKEND=1
  • 默认值:
    • 默认提供商/模型:claude-cli/claude-sonnet-4-6
    • 命令/参数/图像行为来自所属 CLI 后端插件元数据。
  • 覆盖(可选):
    • OPENCLAW_LIVE_CLI_BACKEND_MODEL="codex-cli/gpt-5.5"
    • OPENCLAW_LIVE_CLI_BACKEND_COMMAND="/full/path/to/codex"
    • OPENCLAW_LIVE_CLI_BACKEND_ARGS='["exec","--json","--color","never","--sandbox","read-only","--skip-git-repo-check"]'
    • OPENCLAW_LIVE_CLI_BACKEND_IMAGE_PROBE=1 发送真实图像附件(路径会注入到 prompt 中)。Docker 配方默认关闭此项,除非明确请求。
    • OPENCLAW_LIVE_CLI_BACKEND_IMAGE_ARG="--image" 将图像文件路径作为 CLI 参数传递,而不是注入到 prompt。
    • OPENCLAW_LIVE_CLI_BACKEND_IMAGE_MODE="repeat"(或 "list")控制设置 IMAGE_ARG 时图像参数的传递方式。
    • OPENCLAW_LIVE_CLI_BACKEND_RESUME_PROBE=1 发送第二轮并验证 resume 流程。
    • OPENCLAW_LIVE_CLI_BACKEND_MODEL_SWITCH_PROBE=1 在所选模型支持切换目标时选择加入 Claude Sonnet -> Opus 同会话连续性探测。Docker 配方为整体可靠性默认关闭此项。
    • OPENCLAW_LIVE_CLI_BACKEND_MCP_PROBE=1 选择加入 MCP/工具 loopback 探测。Docker 配方默认关闭此项,除非明确请求。
示例:
OPENCLAW_LIVE_CLI_BACKEND=1 \
  OPENCLAW_LIVE_CLI_BACKEND_MODEL="codex-cli/gpt-5.5" \
  pnpm test:live src/gateway/gateway-cli-backend.live.test.ts
低成本 Gemini MCP 配置冒烟:
OPENCLAW_LIVE_TEST=1 \
  pnpm test:live src/agents/cli-runner/bundle-mcp.gemini.live.test.ts
这不会要求 Gemini 生成响应。它会写入 OpenClaw 给 Gemini 的同一套系统 设置,然后运行 gemini --debug mcp list,以证明已保存的 transport: "streamable-http" 服务器会被规范化为 Gemini 的 HTTP MCP 形状,并且可以连接到本地 streamable-HTTP MCP 服务器。 Docker 配方:
pnpm test:docker:live-cli-backend
单提供商 Docker 配方:
pnpm test:docker:live-cli-backend:claude
pnpm test:docker:live-cli-backend:claude-subscription
pnpm test:docker:live-cli-backend:codex
pnpm test:docker:live-cli-backend:gemini
说明:
  • Docker 运行器位于 scripts/test-live-cli-backend-docker.sh
  • 它会在仓库 Docker 镜像中以非 root 的 node 用户运行 live CLI 后端冒烟。
  • 它从所属插件解析 CLI 冒烟元数据,然后将匹配的 Linux CLI 包(@anthropic-ai/claude-code@openai/codex@google/gemini-cli)安装到 OPENCLAW_DOCKER_CLI_TOOLS_DIR 处的缓存可写前缀中(默认:~/.cache/openclaw/docker-cli-tools)。
  • pnpm test:docker:live-cli-backend:claude-subscription 需要通过 ~/.claude/.credentials.json 中的 claudeAiOauth.subscriptionType 或来自 claude setup-tokenCLAUDE_CODE_OAUTH_TOKEN 提供可移植的 Claude Code 订阅 OAuth。它先在 Docker 中验证直接 claude -p,然后运行两轮 Gateway 网关 CLI 后端,且不保留 Anthropic API key 环境变量。此订阅通道默认禁用 Claude MCP/工具和图像探测,因为 Claude 目前会通过额外用量计费来路由第三方应用使用,而不是走常规订阅计划限制。
  • live CLI 后端冒烟现在会对 Claude、Codex 和 Gemini 执行相同的端到端流程:文本轮次、图像分类轮次,然后通过 Gateway 网关 CLI 验证 MCP cron 工具调用。
  • Claude 的默认冒烟还会将会话从 Sonnet 修补到 Opus,并验证恢复后的会话仍记得较早的注释。

Live:APNs HTTP/2 代理可达性

  • 测试:src/infra/push-apns-http2.live.test.ts
  • 目标:通过本地 HTTP CONNECT 代理隧道连接到 Apple 的 sandbox APNs 端点,发送 APNs HTTP/2 验证请求,并断言 Apple 的真实 403 InvalidProviderToken 响应会通过代理路径返回。
  • 启用:
    • OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_APNS_REACHABILITY=1 pnpm test:live src/infra/push-apns-http2.live.test.ts
  • 可选超时:
    • OPENCLAW_LIVE_APNS_TIMEOUT_MS=30000

Live:ACP 绑定冒烟(/acp spawn ... --bind here

  • 测试:src/gateway/gateway-acp-bind.live.test.ts
  • 目标:使用实时 ACP agent 验证真实 ACP 会话绑定流程:
    • 发送 /acp spawn <agent> --bind here
    • 就地绑定一个合成消息渠道会话
    • 在同一会话中发送普通后续消息
    • 验证后续消息落入已绑定的 ACP 会话 transcript
  • 启用:
    • pnpm test:live src/gateway/gateway-acp-bind.live.test.ts
    • OPENCLAW_LIVE_ACP_BIND=1
  • 默认值:
    • Docker 中的 ACP agents:claude,codex,gemini
    • 直接运行 pnpm test:live ... 时的 ACP agent:claude
    • 合成渠道:Slack 私信风格的会话上下文
    • ACP 后端:acpx
  • 覆盖项:
    • OPENCLAW_LIVE_ACP_BIND_AGENT=claude
    • OPENCLAW_LIVE_ACP_BIND_AGENT=codex
    • OPENCLAW_LIVE_ACP_BIND_AGENT=droid
    • OPENCLAW_LIVE_ACP_BIND_AGENT=gemini
    • OPENCLAW_LIVE_ACP_BIND_AGENT=opencode
    • OPENCLAW_LIVE_ACP_BIND_AGENTS=claude,codex,gemini
    • OPENCLAW_LIVE_ACP_BIND_AGENT_COMMAND='npx -y @agentclientprotocol/claude-agent-acp@<version>'
    • OPENCLAW_LIVE_ACP_BIND_CODEX_MODEL=gpt-5.5
    • OPENCLAW_LIVE_ACP_BIND_OPENCODE_MODEL=opencode/kimi-k2.6
    • OPENCLAW_LIVE_ACP_BIND_REQUIRE_TRANSCRIPT=1
    • OPENCLAW_LIVE_ACP_BIND_REQUIRE_CRON=1
    • OPENCLAW_LIVE_ACP_BIND_PARENT_MODEL=openai/gpt-5.5
  • 说明:
    • 此测试通道使用 Gateway 网关 chat.send 表面,并带有仅限管理员的合成 originating-route 字段,因此测试可以附加消息渠道上下文,而不必假装向外部投递。
    • 未设置 OPENCLAW_LIVE_ACP_BIND_AGENT_COMMAND 时,测试会使用内嵌 acpx 插件的内置 agent 注册表,为选定的 ACP harness agent 提供配置。
    • 默认情况下,已绑定会话的 cron MCP 创建是尽力而为,因为外部 ACP harness 可能会在绑定/图片证明通过后取消 MCP 调用;设置 OPENCLAW_LIVE_ACP_BIND_REQUIRE_CRON=1 可让绑定后的 cron 探针变为严格模式。
示例:
OPENCLAW_LIVE_ACP_BIND=1 \
  OPENCLAW_LIVE_ACP_BIND_AGENT=claude \
  pnpm test:live src/gateway/gateway-acp-bind.live.test.ts
Docker 配方:
pnpm test:docker:live-acp-bind
单 agent Docker 配方:
pnpm test:docker:live-acp-bind:claude
pnpm test:docker:live-acp-bind:codex
pnpm test:docker:live-acp-bind:droid
pnpm test:docker:live-acp-bind:gemini
pnpm test:docker:live-acp-bind:opencode
Docker 说明:
  • Docker 运行器位于 scripts/test-live-acp-bind-docker.sh
  • 默认情况下,它会按顺序针对聚合实时 CLI agents 运行 ACP 绑定冒烟测试:claudecodex,然后是 gemini
  • 使用 OPENCLAW_LIVE_ACP_BIND_AGENTS=claudeOPENCLAW_LIVE_ACP_BIND_AGENTS=codexOPENCLAW_LIVE_ACP_BIND_AGENTS=droidOPENCLAW_LIVE_ACP_BIND_AGENTS=geminiOPENCLAW_LIVE_ACP_BIND_AGENTS=opencode 来缩小矩阵。
  • 它会加载 ~/.profile,把匹配的 CLI 认证材料暂存到容器中,然后在缺失时安装请求的实时 CLI(@anthropic-ai/claude-code@openai/codex、通过 https://app.factory.ai/cli 安装的 Factory Droid、@google/gemini-cliopencode-ai)。ACP 后端本身是官方 acpx 插件中的内嵌 acpx/runtime 包。
  • Droid Docker 变体会暂存 ~/.factory 设置,转发 FACTORY_API_KEY,并且需要该 API key,因为本地 Factory OAuth/keyring 凭证无法移植进容器。它使用 ACPX 内置的 droid exec --output-format acp 注册表条目。
  • OpenCode Docker 变体是严格的单 agent 回归测试通道。它在加载 ~/.profile 后,根据 OPENCLAW_LIVE_ACP_BIND_OPENCODE_MODEL(默认 opencode/kimi-k2.6)写入临时 OPENCODE_CONFIG_CONTENT 默认模型,并且 pnpm test:docker:live-acp-bind:opencode 要求存在已绑定的 assistant transcript,而不是接受通用的绑定后跳过。
  • 直接 acpx CLI 调用仅是用于在 Gateway 网关外比较行为的手动/变通路径。Docker ACP 绑定冒烟测试会运行 OpenClaw 的内嵌 acpx 运行时后端。

实时:Codex app-server harness 冒烟测试

  • 目标:通过常规 Gateway 网关 agent 方法验证插件拥有的 Codex harness:
    • 加载内置 codex 插件
    • 选择 openai/gpt-5.5,它默认会通过 Codex 路由 OpenAI agent 轮次
    • 在已选择 Codex harness 的情况下,向 openai/gpt-5.5 发送第一个 Gateway 网关 agent 轮次
    • 向同一 OpenClaw 会话发送第二个轮次,并验证 app-server thread 可以恢复
    • 通过同一 Gateway 网关命令路径运行 /codex status/codex models
    • 可选运行两个由 Guardian 审核的升级 shell 探针:一个应被批准的良性命令,以及一个应被拒绝并让 agent 反问的伪密钥上传
  • 测试:src/gateway/gateway-codex-harness.live.test.ts
  • 启用:OPENCLAW_LIVE_CODEX_HARNESS=1
  • 默认模型:openai/gpt-5.5
  • 可选图片探针:OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=1
  • 可选 MCP/工具探针:OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=1
  • 可选 Guardian 探针:OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=1
  • 该冒烟测试会强制 provider/model agentRuntime.id: "codex",因此损坏的 Codex harness 无法通过静默回退到 PI 来通过测试。
  • 认证:来自本地 Codex 订阅登录的 Codex app-server 认证。Docker 冒烟测试在适用时也可以为非 Codex 探针提供 OPENAI_API_KEY,以及可选复制的 ~/.codex/auth.json~/.codex/config.toml
本地配方:
source ~/.profile
OPENCLAW_LIVE_CODEX_HARNESS=1 \
  OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=1 \
  OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=1 \
  OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=1 \
  OPENCLAW_LIVE_CODEX_HARNESS_MODEL=openai/gpt-5.5 \
  pnpm test:live -- src/gateway/gateway-codex-harness.live.test.ts
Docker 配方:
source ~/.profile
pnpm test:docker:live-codex-harness
Docker 说明:
  • Docker 运行器位于 scripts/test-live-codex-harness-docker.sh
  • 它会加载挂载的 ~/.profile,传递 OPENAI_API_KEY,在存在时复制 Codex CLI 认证文件,将 @openai/codex 安装到可写的已挂载 npm 前缀中,暂存源码树,然后仅运行 Codex harness 实时测试。
  • Docker 默认启用图片、MCP/工具和 Guardian 探针。当你需要更窄的调试运行时,设置 OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=0OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=0OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=0
  • Docker 使用相同的显式 Codex 运行时配置,因此旧别名或 PI 回退无法掩盖 Codex harness 回归。

推荐实时配方

窄范围、显式的允许列表最快且最不容易不稳定:
  • 单模型,直接运行(不经过 Gateway 网关):
    • OPENCLAW_LIVE_MODELS="openai/gpt-5.5" pnpm test:live src/agents/models.profiles.live.test.ts
  • 单模型,Gateway 网关冒烟测试:
    • OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
  • 跨多个提供商的工具调用:
    • OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5,openai-codex/gpt-5.5,anthropic/claude-opus-4-6,google/gemini-3-flash-preview,deepseek/deepseek-v4-flash,zai/glm-5.1,minimax/MiniMax-M2.7" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
  • Google 聚焦(Gemini API key + Antigravity):
    • Gemini(API key):OPENCLAW_LIVE_GATEWAY_MODELS="google/gemini-3-flash-preview" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
    • Antigravity(OAuth):OPENCLAW_LIVE_GATEWAY_MODELS="google-antigravity/claude-opus-4-6-thinking,google-antigravity/gemini-3-pro-high" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
  • Google adaptive thinking 冒烟测试:
    • 如果本地密钥位于 shell profile 中:source ~/.profile
    • Gemini 3 动态默认值:pnpm openclaw qa manual --provider-mode live-frontier --model google/gemini-3.1-pro-preview --alt-model google/gemini-3.1-pro-preview --message '/think adaptive Reply exactly: GEMINI_ADAPTIVE_OK' --timeout-ms 180000
    • Gemini 2.5 动态预算:pnpm openclaw qa manual --provider-mode live-frontier --model google/gemini-2.5-flash --alt-model google/gemini-2.5-flash --message '/think adaptive Reply exactly: GEMINI25_ADAPTIVE_OK' --timeout-ms 180000
说明:
  • google/... 使用 Gemini API(API key)。
  • google-antigravity/... 使用 Antigravity OAuth bridge(Cloud Code Assist 风格的 agent endpoint)。
  • google-gemini-cli/... 使用你机器上的本地 Gemini CLI(独立认证 + 工具怪异行为)。
  • Gemini API 与 Gemini CLI:
    • API:OpenClaw 通过 HTTP 调用 Google 托管的 Gemini API(API key / profile auth);这也是大多数用户所说的 “Gemini”。
    • CLI:OpenClaw shell 调用本地 gemini 二进制文件;它有自己的认证,并且可能表现不同(流式传输/工具支持/版本偏差)。

实时:模型矩阵(覆盖范围)

没有固定的 “CI 模型列表”(实时测试是选择启用的),但以下是建议在带有密钥的开发机器上定期覆盖的推荐模型。

现代冒烟测试集(工具调用 + 图片)

这是我们期望保持可用的“常见模型”运行:
  • OpenAI(非 Codex):openai/gpt-5.5
  • OpenAI Codex OAuth:openai-codex/gpt-5.5
  • Anthropic:anthropic/claude-opus-4-6(或 anthropic/claude-sonnet-4-6
  • Google(Gemini API):google/gemini-3.1-pro-previewgoogle/gemini-3-flash-preview(避免较旧的 Gemini 2.x 模型)
  • Google(Antigravity):google-antigravity/claude-opus-4-6-thinkinggoogle-antigravity/gemini-3-flash
  • DeepSeek:deepseek/deepseek-v4-flashdeepseek/deepseek-v4-pro
  • Z.AI(GLM):zai/glm-5.1
  • MiniMax:minimax/MiniMax-M2.7
使用工具 + 图片运行 Gateway 网关冒烟测试: OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5,openai-codex/gpt-5.5,anthropic/claude-opus-4-6,google/gemini-3.1-pro-preview,google/gemini-3-flash-preview,google-antigravity/claude-opus-4-6-thinking,google-antigravity/gemini-3-flash,deepseek/deepseek-v4-flash,zai/glm-5.1,minimax/MiniMax-M2.7" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts

基线:工具调用(Read + 可选 Exec)

每个提供商家族至少选择一个:
  • OpenAI:openai/gpt-5.5
  • Anthropic:anthropic/claude-opus-4-6(或 anthropic/claude-sonnet-4-6
  • Google:google/gemini-3-flash-preview(或 google/gemini-3.1-pro-preview
  • DeepSeek:deepseek/deepseek-v4-flash
  • Z.AI(GLM):zai/glm-5.1
  • MiniMax:minimax/MiniMax-M2.7
可选额外覆盖(有则更好):
  • xAI:xai/grok-4.3(或最新可用版本)
  • Mistral:mistral/…(选择一个你已启用且支持“tools”的模型)
  • Cerebras:cerebras/…(如果你有访问权限)
  • LM Studio:lmstudio/…(本地;工具调用取决于 API 模式)

视觉:图片发送(附件 → 多模态消息)

OPENCLAW_LIVE_GATEWAY_MODELS 中包含至少一个支持图片的模型(Claude/Gemini/OpenAI 视觉能力变体等),以运行图片探针。

聚合器 / 备用 Gateway 网关

如果你已启用密钥,我们也支持通过以下方式测试:
  • OpenRouter:openrouter/...(数百个模型;使用 openclaw models scan 查找支持工具+图片的候选模型)
  • OpenCode:opencode/... 用于 Zen,opencode-go/... 用于 Go(通过 OPENCODE_API_KEY / OPENCODE_ZEN_API_KEY 认证)
你可以包含在实时矩阵中的更多提供商(如果你有凭证/配置):
  • 内置:openaiopenai-codexanthropicgooglegoogle-vertexgoogle-antigravitygoogle-gemini-clizaiopenrouteropencodeopencode-goxaigroqcerebrasmistralgithub-copilot
  • 通过 models.providers(自定义 endpoint):minimax(云/API),以及任何 OpenAI/Anthropic 兼容代理(LM Studio、vLLM、LiteLLM 等)
不要在文档中硬编码“所有模型”。权威列表是你的机器上 discoverModels(...) 返回的内容,以及可用密钥共同决定的内容。

凭证(切勿提交)

实时测试会以 CLI 相同的方式发现凭证。实际影响:
  • 如果 CLI 可用,实时测试应能找到相同的密钥。
  • 如果实时测试提示“无凭据”,请用调试 openclaw models list / 模型选择的相同方式进行调试。
  • 每个 Agent 的认证配置文件:~/.openclaw/agents/<agentId>/agent/auth-profiles.json(这就是实时测试中“profile 键”的含义)
  • 配置:~/.openclaw/openclaw.json(或 OPENCLAW_CONFIG_PATH
  • 旧版状态目录:~/.openclaw/credentials/(存在时会复制到暂存的实时测试主目录中,但不是主要的 profile 键存储位置)
  • 默认情况下,本地实时运行会将活动配置、每个 Agent 的 auth-profiles.json 文件、旧版 credentials/ 以及受支持的外部 CLI 认证目录复制到临时测试主目录中;暂存的实时测试主目录会跳过 workspace/sandboxes/,并剥离 agents.*.workspace / agentDir 路径覆盖,以确保探测不会触及你真实主机上的工作区。
如果你想依赖环境变量密钥(例如在你的 ~/.profile 中导出的密钥),请在 source ~/.profile 后运行本地测试,或使用下面的 Docker 运行器(它们可以将 ~/.profile 挂载到容器中)。

Deepgram 实时测试(音频转录)

  • 测试:extensions/deepgram/audio.live.test.ts
  • 启用:DEEPGRAM_API_KEY=... DEEPGRAM_LIVE_TEST=1 pnpm test:live extensions/deepgram/audio.live.test.ts

BytePlus 编码计划实时测试

  • 测试:extensions/byteplus/live.test.ts
  • 启用:BYTEPLUS_API_KEY=... BYTEPLUS_LIVE_TEST=1 pnpm test:live extensions/byteplus/live.test.ts
  • 可选模型覆盖:BYTEPLUS_CODING_MODEL=ark-code-latest

ComfyUI 工作流媒体实时测试

  • 测试:extensions/comfy/comfy.live.test.ts
  • 启用:OPENCLAW_LIVE_TEST=1 COMFY_LIVE_TEST=1 pnpm test:live -- extensions/comfy/comfy.live.test.ts
  • 范围:
    • 覆盖内置的 comfy 图像、视频和 music_generate 路径
    • 除非已配置 plugins.entries.comfy.config.<capability>,否则跳过对应能力
    • 适用于更改 comfy 工作流提交、轮询、下载或插件注册之后

图像生成实时测试

  • 测试:test/image-generation.runtime.live.test.ts
  • 命令:pnpm test:live test/image-generation.runtime.live.test.ts
  • 测试框架:pnpm test:live:media image
  • 范围:
    • 枚举每个已注册的图像生成提供商插件
    • 在探测前从你的登录 shell(~/.profile)加载缺失的提供商环境变量
    • 默认优先使用实时/环境变量 API 密钥,而不是已存储的认证配置文件,因此 auth-profiles.json 中过期的测试密钥不会遮蔽真实的 shell 凭据
    • 跳过没有可用认证/profile/模型的提供商
    • 通过共享的图像生成运行时运行每个已配置的提供商:
      • <provider>:generate
      • 当提供商声明支持编辑时运行 <provider>:edit
  • 当前覆盖的内置提供商:
    • deepinfra
    • fal
    • google
    • minimax
    • openai
    • openrouter
    • vydra
    • xai
  • 可选缩小范围:
    • OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS="openai,google,openrouter,xai"
    • OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS="deepinfra"
    • OPENCLAW_LIVE_IMAGE_GENERATION_MODELS="openai/gpt-image-2,google/gemini-3.1-flash-image-preview,openrouter/google/gemini-3.1-flash-image-preview,xai/grok-imagine-image"
    • OPENCLAW_LIVE_IMAGE_GENERATION_CASES="google:flash-generate,google:pro-edit,openrouter:generate,xai:default-generate,xai:default-edit"
  • 可选认证行为:
    • OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1 用于强制使用 profile 存储认证,并忽略仅环境变量的覆盖
对于已发布的 CLI 路径,请在提供商/运行时实时测试通过后添加一次 infer 冒烟测试:
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_INFER_CLI_TEST=1 pnpm test:live -- test/image-generation.infer-cli.live.test.ts
openclaw infer image providers --json
openclaw infer image generate \
  --model google/gemini-3.1-flash-image-preview \
  --prompt "Minimal flat test image: one blue square on a white background, no text." \
  --output ./openclaw-infer-image-smoke.png \
  --json
这会覆盖 CLI 参数解析、配置/默认 Agent 解析、内置插件激活、共享图像生成运行时以及实时提供商请求。预期插件依赖项在运行时加载前已存在。

音乐生成实时测试

  • 测试:extensions/music-generation-providers.live.test.ts
  • 启用:OPENCLAW_LIVE_TEST=1 pnpm test:live -- extensions/music-generation-providers.live.test.ts
  • 测试框架:pnpm test:live:media music
  • 范围:
    • 覆盖共享的内置音乐生成提供商路径
    • 当前覆盖 Google 和 MiniMax
    • 在探测前从你的登录 shell(~/.profile)加载提供商环境变量
    • 默认优先使用实时/环境变量 API 密钥,而不是已存储的认证配置文件,因此 auth-profiles.json 中过期的测试密钥不会遮蔽真实的 shell 凭据
    • 跳过没有可用认证/profile/模型的提供商
    • 在可用时运行两个已声明的运行时模式:
      • 使用仅提示词输入的 generate
      • 当提供商声明 capabilities.edit.enabled 时运行 edit
    • 当前共享测试通道覆盖范围:
      • googlegenerateedit
      • minimaxgenerate
      • comfy:独立的 Comfy 实时测试文件,不包含在此共享扫测中
  • 可选缩小范围:
    • OPENCLAW_LIVE_MUSIC_GENERATION_PROVIDERS="google,minimax"
    • OPENCLAW_LIVE_MUSIC_GENERATION_MODELS="google/lyria-3-clip-preview,minimax/music-2.6"
  • 可选认证行为:
    • OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1 用于强制使用 profile 存储认证,并忽略仅环境变量的覆盖

视频生成实时测试

  • 测试:extensions/video-generation-providers.live.test.ts
  • 启用:OPENCLAW_LIVE_TEST=1 pnpm test:live -- extensions/video-generation-providers.live.test.ts
  • 测试框架:pnpm test:live:media video
  • 范围:
    • 覆盖共享的内置视频生成提供商路径
    • 默认使用发布安全的冒烟路径:非 FAL 提供商、每个提供商一次文本转视频请求、一秒的龙虾提示词,以及来自 OPENCLAW_LIVE_VIDEO_GENERATION_TIMEOUT_MS 的每个提供商操作上限(默认为 180000
    • 默认跳过 FAL,因为提供商侧队列延迟可能主导发布时间;传入 --video-providers falOPENCLAW_LIVE_VIDEO_GENERATION_PROVIDERS="fal" 可显式运行它
    • 在探测前从你的登录 shell(~/.profile)加载提供商环境变量
    • 默认优先使用实时/环境变量 API 密钥,而不是已存储的认证配置文件,因此 auth-profiles.json 中过期的测试密钥不会遮蔽真实的 shell 凭据
    • 跳过没有可用认证/profile/模型的提供商
    • 默认仅运行 generate
    • 设置 OPENCLAW_LIVE_VIDEO_GENERATION_FULL_MODES=1 后,也会在可用时运行已声明的转换模式:
      • 当提供商声明 capabilities.imageToVideo.enabled,且所选提供商/模型在共享扫测中接受基于缓冲区的本地图像输入时运行 imageToVideo
      • 当提供商声明 capabilities.videoToVideo.enabled,且所选提供商/模型在共享扫测中接受基于缓冲区的本地视频输入时运行 videoToVideo
    • 当前在共享扫测中已声明但跳过的 imageToVideo 提供商:
      • vydra,因为内置的 veo3 仅支持文本,内置的 kling 需要远程图像 URL
    • Vydra 提供商专项覆盖:
      • OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_VYDRA_VIDEO=1 pnpm test:live -- extensions/vydra/vydra.live.test.ts
      • 该文件会运行 veo3 文本转视频,以及默认使用远程图像 URL fixture 的 kling 通道
    • 当前 videoToVideo 实时覆盖:
      • 仅当所选模型为 runway/gen4_aleph 时覆盖 runway
    • 当前在共享扫测中已声明但跳过的 videoToVideo 提供商:
      • alibabaqwenxai,因为这些路径当前需要远程 http(s) / MP4 参考 URL
      • google,因为当前共享 Gemini/Veo 通道使用基于本地缓冲区的输入,而该路径在共享扫测中不被接受
      • openai,因为当前共享通道缺少特定组织的视频修复/混剪访问保证
  • 可选缩小范围:
    • OPENCLAW_LIVE_VIDEO_GENERATION_PROVIDERS="deepinfra,google,openai,runway"
    • OPENCLAW_LIVE_VIDEO_GENERATION_MODELS="google/veo-3.1-fast-generate-preview,openai/sora-2,runway/gen4_aleph"
    • OPENCLAW_LIVE_VIDEO_GENERATION_SKIP_PROVIDERS="" 用于在默认扫测中包含每个提供商,包括 FAL
    • OPENCLAW_LIVE_VIDEO_GENERATION_TIMEOUT_MS=60000 用于降低每个提供商操作上限,以进行更激进的冒烟运行
  • 可选认证行为:
    • OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1 用于强制使用 profile 存储认证,并忽略仅环境变量的覆盖

媒体实时测试框架

  • 命令:pnpm test:live:media
  • 目的:
    • 通过一个仓库原生入口点运行共享的图像、音乐和视频实时测试套件
    • ~/.profile 自动加载缺失的提供商环境变量
    • 默认自动将每个套件缩小到当前具有可用认证的提供商
    • 复用 scripts/test-live.mjs,因此 Heartbeat 和静默模式行为保持一致
  • 示例:
    • pnpm test:live:media
    • pnpm test:live:media image video --providers openai,google,minimax
    • pnpm test:live:media video --video-providers openai,runway --all-providers
    • pnpm test:live:media music --quiet

相关

  • 测试 - 单元、集成、QA 和 Docker 套件