Тестирование: live-наборы

Для быстрого старта, QA-раннеров, наборов unit/integration-тестов и Docker-потоков см. Тестирование. Эта страница описывает live-наборы тестов (затрагивающие сеть): матрицу моделей, CLI-бэкенды, ACP и live-тесты медиапровайдеров, а также работу с учетными данными.

Live: локальные smoke-команды

Перед разовыми live-проверками экспортируйте нужный ключ провайдера в окружение процесса. Безопасный media-smoke:

pnpm openclaw infer tts convert --local --json \
  --text "OpenClaw live smoke." \
  --output /tmp/openclaw-live-smoke.mp3

Безопасный smoke готовности голосового вызова:

pnpm openclaw voicecall setup --json
pnpm openclaw voicecall smoke --to "+15555550123"

voicecall smoke выполняет пробный прогон, если также не указан --yes. Используйте --yes только когда вы намеренно хотите выполнить реальный уведомительный звонок. Для Twilio, Telnyx и Plivo успешная проверка готовности требует публичный URL Webhook; локальные loopback/приватные fallback-варианты отклоняются намеренно.

Live: проверка возможностей Android-узла

Тест: src/gateway/android-node.capabilities.live.test.ts
Скрипт: pnpm android:test:integration
Цель: вызвать каждую команду, объявляемую сейчас подключенным Android-узлом, и проверить поведение контракта команды.
Область:
- Предварительная/ручная настройка (набор тестов не устанавливает, не запускает и не сопрягает приложение).
- Проверка gateway node.invoke команда за командой для выбранного Android-узла.
Обязательная предварительная настройка:
- Android-приложение уже подключено и сопряжено с Gateway.
- Приложение удерживается на переднем плане.
- Разрешения/согласие на захват предоставлены для возможностей, которые должны проходить.
Необязательные переопределения цели:
- OPENCLAW_ANDROID_NODE_ID или OPENCLAW_ANDROID_NODE_NAME.
- OPENCLAW_ANDROID_GATEWAY_URL / OPENCLAW_ANDROID_GATEWAY_TOKEN / OPENCLAW_ANDROID_GATEWAY_PASSWORD.
Полные сведения о настройке Android: Android-приложение

Live: model smoke (ключи профилей)

Live-тесты разделены на два уровня, чтобы мы могли изолировать сбои:

«Прямая модель» показывает, что провайдер/модель вообще может ответить с данным ключом.
«Gateway smoke» показывает, что для этой модели работает весь конвейер gateway+agent (сессии, история, инструменты, sandbox-политика и т. д.).

Уровень 1: прямое completion модели (без Gateway)

Тест: src/agents/models.profiles.live.test.ts
Цель:
- Перечислить обнаруженные модели
- Использовать getApiKeyForModel, чтобы выбрать модели, для которых у вас есть учетные данные
- Запустить небольшое completion для каждой модели (и точечные регрессии там, где нужно)
Как включить:
- pnpm test:live (или OPENCLAW_LIVE_TEST=1, если вызываете Vitest напрямую)
Установите OPENCLAW_LIVE_MODELS=modern, small или all (алиас для modern), чтобы действительно запустить этот набор; иначе он пропускается, чтобы pnpm test:live оставался сосредоточен на gateway smoke
Как выбрать модели:
- OPENCLAW_LIVE_MODELS=modern, чтобы запустить современный allowlist (Opus/Sonnet 4.6+, GPT-5.2 + Codex, Gemini 3, DeepSeek V4, GLM 5.1, MiniMax M3, Grok 4.3)
- OPENCLAW_LIVE_MODELS=small, чтобы запустить ограниченный allowlist малых моделей (локально совместимые маршруты Qwen 8B/9B, Ollama Gemma, OpenRouter Qwen/GLM и Z.AI GLM)
- OPENCLAW_LIVE_MODELS=all — алиас для современного allowlist
- или OPENCLAW_LIVE_MODELS="openai/gpt-5.5,anthropic/claude-opus-4-6,..." (allowlist через запятую)
- Локальные запуски малых моделей Ollama по умолчанию используют http://127.0.0.1:11434; задавайте OPENCLAW_LIVE_OLLAMA_BASE_URL только для LAN, пользовательских endpoint-ов или Ollama Cloud.
- Проверки modern/all и small по умолчанию используют свои курируемые лимиты; задайте OPENCLAW_LIVE_MAX_MODELS=0 для исчерпывающей проверки выбранного профиля или положительное число для меньшего лимита.
- Исчерпывающие проверки используют OPENCLAW_LIVE_TEST_TIMEOUT_MS как timeout всего прямого теста моделей. По умолчанию: 60 минут.
- Пробы прямых моделей по умолчанию выполняются с параллелизмом 20; задайте OPENCLAW_LIVE_MODEL_CONCURRENCY, чтобы переопределить.
Как выбрать провайдеров:
- OPENCLAW_LIVE_PROVIDERS="google,google-antigravity,google-gemini-cli" (allowlist через запятую)
Откуда берутся ключи:
- По умолчанию: хранилище профилей и fallback-значения окружения
- Задайте OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1, чтобы принудительно использовать только хранилище профилей
Зачем это существует:
- Отделяет «API провайдера сломан / ключ недействителен» от «конвейер gateway agent сломан»
- Содержит небольшие изолированные регрессии (пример: reasoning replay OpenAI Responses/Codex Responses + потоки tool-call)

Уровень 2: Gateway + smoke dev-агента (что на самом деле делает “@openclaw”)

Тест: src/gateway/gateway-models.profiles.live.test.ts
Цель:
- Запустить внутрипроцессный Gateway
- Создать/пропатчить сессию agent:dev:* (переопределение модели для каждого запуска)
- Перебрать модели с ключами и проверить:
  - «содержательный» ответ (без инструментов)
  - реальный вызов инструмента работает (проба чтения)
  - необязательные дополнительные пробы инструментов (проба exec+read)
  - регрессионные пути OpenAI (только tool-call → follow-up) продолжают работать
Детали проб (чтобы быстро объяснять сбои):
- Проба read: тест записывает nonce-файл в workspace и просит агента read его и вернуть nonce в ответе.
- Проба exec+read: тест просит агента через exec записать nonce во временный файл, затем прочитать его через read.
- Проба изображения: тест прикрепляет сгенерированный PNG (cat + рандомизированный код) и ожидает, что модель вернет cat <CODE>.
- Ссылка на реализацию: src/gateway/gateway-models.profiles.live.test.ts и test/helpers/live-image-probe.ts.
Как включить:
- pnpm test:live (или OPENCLAW_LIVE_TEST=1, если вызываете Vitest напрямую)
Как выбрать модели:
- По умолчанию: современный allowlist (Opus/Sonnet 4.6+, GPT-5.2 + Codex, Gemini 3, DeepSeek V4, GLM 4.7, MiniMax M3, Grok 4.3)
- OPENCLAW_LIVE_GATEWAY_MODELS=small, чтобы прогнать тот же ограниченный allowlist малых моделей через полный конвейер gateway+agent
- OPENCLAW_LIVE_GATEWAY_MODELS=all — алиас для современного allowlist
- Или задайте OPENCLAW_LIVE_GATEWAY_MODELS="provider/model" (или список через запятую), чтобы сузить выбор
- Проверки gateway modern/all и small по умолчанию используют свои курируемые лимиты; задайте OPENCLAW_LIVE_GATEWAY_MAX_MODELS=0 для исчерпывающей выбранной проверки или положительное число для меньшего лимита.
Как выбрать провайдеров (избежать «весь OpenRouter»):
- OPENCLAW_LIVE_GATEWAY_PROVIDERS="google,google-antigravity,google-gemini-cli,openai,anthropic,zai,minimax" (allowlist через запятую)
Пробы инструментов и изображений всегда включены в этом live-тесте:
- Проба read + проба exec+read (нагрузка на инструменты)
- Проба изображения запускается, когда модель объявляет поддержку входных изображений
- Поток (верхнеуровнево):
  - Тест генерирует крошечный PNG с “CAT” + случайным кодом (test/helpers/live-image-probe.ts)
  - Отправляет его через agent attachments: [{ mimeType: "image/png", content: "<base64>" }]
  - Gateway разбирает вложения в images[] (src/gateway/server-methods/agent.ts + src/gateway/chat-attachments.ts)
  - Встроенный агент пересылает мультимодальное пользовательское сообщение модели
  - Проверка: ответ содержит cat + код (допуск OCR: разрешены небольшие ошибки)

Чтобы увидеть, что можно тестировать на вашей машине (и точные id provider/model), выполните:

openclaw models list
openclaw models list --json

Live: smoke CLI-бэкенда (Claude, Gemini или другие локальные CLI)

Тест: src/gateway/gateway-cli-backend.live.test.ts
Цель: проверить конвейер Gateway + agent с использованием локального CLI-бэкенда, не затрагивая вашу конфигурацию по умолчанию.
Специфичные для бэкенда значения smoke по умолчанию находятся в определении cli-backend.ts владеющего Plugin.
Включение:
- pnpm test:live (или OPENCLAW_LIVE_TEST=1, если вызываете Vitest напрямую)
- OPENCLAW_LIVE_CLI_BACKEND=1
Значения по умолчанию:
- Провайдер/модель по умолчанию: claude-cli/claude-sonnet-4-6
- Поведение команды/аргументов/изображений берется из метаданных владеющего CLI backend Plugin.
Переопределения (необязательно):
- OPENCLAW_LIVE_CLI_BACKEND_MODEL="claude-cli/claude-sonnet-4-6"
- OPENCLAW_LIVE_CLI_BACKEND_COMMAND="/full/path/to/claude"
- OPENCLAW_LIVE_CLI_BACKEND_ARGS='["-p","--output-format","json"]'
- OPENCLAW_LIVE_CLI_BACKEND_IMAGE_PROBE=1, чтобы отправить реальное вложение-изображение (пути внедряются в prompt). Docker-рецепты по умолчанию отключают это, если явно не запрошено.
- OPENCLAW_LIVE_CLI_BACKEND_IMAGE_ARG="--image", чтобы передавать пути к файлам изображений как CLI-аргументы вместо внедрения в prompt.
- OPENCLAW_LIVE_CLI_BACKEND_IMAGE_MODE="repeat" (или "list"), чтобы управлять тем, как передаются аргументы изображений при заданном IMAGE_ARG.
- OPENCLAW_LIVE_CLI_BACKEND_RESUME_PROBE=1, чтобы отправить второй ход и проверить поток resume.
- OPENCLAW_LIVE_CLI_BACKEND_MODEL_SWITCH_PROBE=1, чтобы включить пробу непрерывности Claude Sonnet -> Opus в той же сессии, когда выбранная модель поддерживает целевое переключение. Docker-рецепты по умолчанию отключают это для общей надежности.
- OPENCLAW_LIVE_CLI_BACKEND_MCP_PROBE=1, чтобы включить пробу loopback MCP/инструментов. Docker-рецепты по умолчанию отключают это, если явно не запрошено.

Пример:

  OPENCLAW_LIVE_CLI_BACKEND=1 \
  OPENCLAW_LIVE_CLI_BACKEND_MODEL="claude-cli/claude-sonnet-4-6" \
  pnpm test:live src/gateway/gateway-cli-backend.live.test.ts

Дешевый smoke конфигурации Gemini MCP:

OPENCLAW_LIVE_TEST=1 \
  pnpm test:live src/agents/cli-runner/bundle-mcp.gemini.live.test.ts

Это не просит Gemini генерировать ответ. Он записывает те же системные настройки, которые OpenClaw передает Gemini, затем выполняет gemini --debug mcp list, чтобы доказать, что сохраненный сервер transport: "streamable-http" нормализуется в HTTP MCP-форму Gemini и может подключиться к локальному streamable-HTTP MCP-серверу. Docker-рецепт:

pnpm test:docker:live-cli-backend

Docker-рецепты для отдельных провайдеров:

pnpm test:docker:live-cli-backend:claude
pnpm test:docker:live-cli-backend:claude-subscription
pnpm test:docker:live-cli-backend:gemini

Примечания:

Docker-раннер находится в scripts/test-live-cli-backend-docker.sh.
Он запускает live-smoke CLI-бэкенда внутри Docker-образа репозитория от непривилегированного пользователя node.
Он разрешает CLI smoke-метаданные из владеющего Plugin, затем устанавливает соответствующий Linux CLI-пакет (@anthropic-ai/claude-code или @google/gemini-cli) в кэшируемый записываемый префикс по OPENCLAW_DOCKER_CLI_TOOLS_DIR (по умолчанию: ~/.cache/openclaw/docker-cli-tools).
pnpm test:docker:live-cli-backend:claude-subscription требует переносимый OAuth подписки Claude Code через ~/.claude/.credentials.json с claudeAiOauth.subscriptionType или CLAUDE_CODE_OAUTH_TOKEN из claude setup-token. Сначала он доказывает прямой claude -p в Docker, затем выполняет два хода Gateway CLI-бэкенда без сохранения env vars API-ключей Anthropic. Эта subscription-линия по умолчанию отключает пробы Claude MCP/инструментов и изображений, потому что она расходует лимиты использования подписки с входом в систему, а Anthropic может менять поведение биллинга и rate-limit для Claude Agent SDK / claude -p без релиза OpenClaw.
Live-smoke CLI-бэкенда теперь выполняет один и тот же сквозной поток для Claude и Gemini: текстовый ход, ход классификации изображения, затем вызов инструмента MCP cron, проверенный через gateway CLI.
Smoke Claude по умолчанию также патчит сессию с Sonnet на Opus и проверяет, что возобновленная сессия все еще помнит более раннюю заметку.

Live: достижимость APNs HTTP/2 proxy

Тест: src/infra/push-apns-http2.live.test.ts
Цель: пройти туннелем через локальный HTTP CONNECT proxy к sandbox endpoint Apple APNs, отправить APNs HTTP/2 validation request и проверить, что реальный ответ Apple 403 InvalidProviderToken возвращается через proxy-путь.
Включение:
- OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_APNS_REACHABILITY=1 pnpm test:live src/infra/push-apns-http2.live.test.ts
Необязательный timeout:
- OPENCLAW_LIVE_APNS_TIMEOUT_MS=30000

Live: ACP bind smoke (`/acp spawn ... --bind here`)

Тест: src/gateway/gateway-acp-bind.live.test.ts
Цель: проверить реальный поток привязки беседы ACP с live-агентом ACP:
- отправить /acp spawn <agent> --bind here
- привязать синтетическую беседу канала сообщений на месте
- отправить обычное последующее сообщение в той же беседе
- проверить, что последующее сообщение попадает в транскрипт привязанной сессии ACP
Включение:
- pnpm test:live src/gateway/gateway-acp-bind.live.test.ts
- OPENCLAW_LIVE_ACP_BIND=1
Значения по умолчанию:
- агенты ACP в Docker: claude,codex,gemini
- агент ACP для прямого pnpm test:live ...: claude
- синтетический канал: контекст беседы в стиле Slack DM
- бэкенд ACP: acpx
Переопределения:
- OPENCLAW_LIVE_ACP_BIND_AGENT=claude
- OPENCLAW_LIVE_ACP_BIND_AGENT=codex
- OPENCLAW_LIVE_ACP_BIND_AGENT=droid
- OPENCLAW_LIVE_ACP_BIND_AGENT=gemini
- OPENCLAW_LIVE_ACP_BIND_AGENT=opencode
- OPENCLAW_LIVE_ACP_BIND_AGENTS=claude,codex,gemini
- OPENCLAW_LIVE_ACP_BIND_AGENT_COMMAND='npx -y @agentclientprotocol/claude-agent-acp@<version>'
- OPENCLAW_LIVE_ACP_BIND_CODEX_MODEL=gpt-5.5
- OPENCLAW_LIVE_ACP_BIND_OPENCODE_MODEL=opencode/kimi-k2.6
- OPENCLAW_LIVE_ACP_BIND_REQUIRE_TRANSCRIPT=1
- OPENCLAW_LIVE_ACP_BIND_REQUIRE_CRON=1
- OPENCLAW_LIVE_ACP_BIND_PARENT_MODEL=openai/gpt-5.5
Примечания:
- Этот lane использует поверхность Gateway chat.send с синтетическими полями исходного маршрута только для администраторов, чтобы тесты могли присоединять контекст канала сообщений, не имитируя внешнюю доставку.
- Когда OPENCLAW_LIVE_ACP_BIND_AGENT_COMMAND не задан, тест использует встроенный реестр агентов встроенного Plugin acpx для выбранного агента ACP harness.
- Создание MCP для Cron привязанной сессии по умолчанию выполняется по принципу best-effort, потому что внешние ACP harness могут отменять вызовы MCP после прохождения проверки привязки/изображения; задайте OPENCLAW_LIVE_ACP_BIND_REQUIRE_CRON=1, чтобы сделать эту проверку Cron после привязки строгой.

Пример:

OPENCLAW_LIVE_ACP_BIND=1 \
  OPENCLAW_LIVE_ACP_BIND_AGENT=claude \
  pnpm test:live src/gateway/gateway-acp-bind.live.test.ts

Рецепт Docker:

pnpm test:docker:live-acp-bind

Рецепты Docker для одного агента:

pnpm test:docker:live-acp-bind:claude
pnpm test:docker:live-acp-bind:codex
pnpm test:docker:live-acp-bind:droid
pnpm test:docker:live-acp-bind:gemini
pnpm test:docker:live-acp-bind:opencode

Примечания Docker:

Docker runner находится в scripts/test-live-acp-bind-docker.sh.
По умолчанию он последовательно запускает smoke привязки ACP для агрегированных live-агентов CLI: claude, codex, затем gemini.
Используйте OPENCLAW_LIVE_ACP_BIND_AGENTS=claude, OPENCLAW_LIVE_ACP_BIND_AGENTS=codex, OPENCLAW_LIVE_ACP_BIND_AGENTS=droid, OPENCLAW_LIVE_ACP_BIND_AGENTS=gemini или OPENCLAW_LIVE_ACP_BIND_AGENTS=opencode, чтобы сузить матрицу.
Он подготавливает соответствующие материалы аутентификации CLI в контейнере, затем устанавливает запрошенный live CLI (@anthropic-ai/claude-code, @openai/codex, Factory Droid через https://app.factory.ai/cli, @google/gemini-cli или opencode-ai), если он отсутствует. Сам бэкенд ACP — встроенный пакет acpx/runtime из официального Plugin acpx.
Вариант Droid Docker подготавливает ~/.factory для настроек, пробрасывает FACTORY_API_KEY и требует этот ключ API, потому что локальная аутентификация Factory OAuth/keyring непереносима в контейнер. Он использует встроенную запись реестра ACPX droid exec --output-format acp.
Вариант OpenCode Docker — строгий regression lane для одного агента. Он записывает временную модель по умолчанию OPENCODE_CONFIG_CONTENT из OPENCLAW_LIVE_ACP_BIND_OPENCODE_MODEL (по умолчанию opencode/kimi-k2.6), а pnpm test:docker:live-acp-bind:opencode требует транскрипт привязанного assistant вместо принятия общего пропуска после привязки.
Прямые вызовы CLI acpx — только ручной путь/обходной путь для сравнения поведения вне Gateway. Smoke привязки Docker ACP проверяет встроенный runtime-бэкенд acpx OpenClaw.

Live: smoke harness Codex app-server

Цель: проверить принадлежащий Plugin harness Codex через обычный метод Gateway agent:
- загрузить bundled Plugin codex
- выбрать openai/gpt-5.5, который по умолчанию маршрутизирует агентские ходы OpenAI через Codex
- отправить первый агентский ход Gateway в openai/gpt-5.5 с выбранным harness Codex
- отправить второй ход в ту же сессию OpenClaw и проверить, что thread app-server может возобновиться
- выполнить /codex status и /codex models через тот же путь команд Gateway
- опционально выполнить две проверенные Guardian shell-проверки с повышенными правами: одну безвредную команду, которая должна быть одобрена, и одну загрузку fake-secret, которая должна быть отклонена, чтобы агент задал уточняющий вопрос
Тест: src/gateway/gateway-codex-harness.live.test.ts
Включение: OPENCLAW_LIVE_CODEX_HARNESS=1
Модель по умолчанию: openai/gpt-5.5
Опциональная проверка изображения: OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=1
Опциональная проверка MCP/инструмента: OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=1
Опциональная проверка Guardian: OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=1
Smoke принудительно задает provider/model agentRuntime.id: "codex", чтобы сломанный harness Codex не мог пройти за счет тихого fallback к OpenClaw.
Аутентификация: аутентификация Codex app-server из локального входа по подписке Codex. Docker smokes также могут предоставлять OPENAI_API_KEY для не-Codex проверок, когда применимо, а также опционально скопированные ~/.codex/auth.json и ~/.codex/config.toml.

Локальный рецепт:

OPENCLAW_LIVE_CODEX_HARNESS=1 \
  OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=1 \
  OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=1 \
  OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=1 \
  OPENCLAW_LIVE_CODEX_HARNESS_MODEL=openai/gpt-5.5 \
  pnpm test:live -- src/gateway/gateway-codex-harness.live.test.ts

Рецепт Docker:

pnpm test:docker:live-codex-harness

Примечания Docker:

Docker runner находится в scripts/test-live-codex-harness-docker.sh.
Он передает OPENAI_API_KEY, копирует файлы аутентификации Codex CLI при наличии, устанавливает @openai/codex в доступный для записи смонтированный npm prefix, подготавливает дерево исходного кода, затем запускает только live-тест Codex-harness.
Docker по умолчанию включает проверки изображения, MCP/инструмента и Guardian. Задайте OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=0 или OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=0 или OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=0, когда нужен более узкий отладочный запуск.
Docker использует ту же явную конфигурацию runtime Codex, поэтому legacy alias или fallback OpenClaw не могут скрыть регрессию harness Codex.

Live: матрица моделей (что мы покрываем)

Фиксированного “списка моделей CI” нет (live включается явно), но это рекомендуемые модели для регулярного покрытия на dev-машине с ключами.

Современный smoke-набор (вызов инструментов + изображение)

Это запуск “common models”, который, как ожидается, должен продолжать работать:

OpenAI (не Codex): openai/gpt-5.5
OpenAI ChatGPT/Codex OAuth: openai/gpt-5.5
Anthropic: anthropic/claude-opus-4-6 (или anthropic/claude-sonnet-4-6)
Google (Gemini API): google/gemini-3.1-pro-preview и google/gemini-3-flash-preview (избегайте более старых моделей Gemini 2.x)
Google (Antigravity): google-antigravity/claude-opus-4-6-thinking и google-antigravity/gemini-3-flash
DeepSeek: deepseek/deepseek-v4-flash и deepseek/deepseek-v4-pro
Z.AI (GLM): zai/glm-5.1 (общий API) или zai/glm-5.2 (Coding Plan)
MiniMax: minimax/MiniMax-M3

Запустите smoke Gateway с инструментами + изображением:

OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5,anthropic/claude-opus-4-6,google/gemini-3.1-pro-preview,google/gemini-3-flash-preview,google-antigravity/claude-opus-4-6-thinking,google-antigravity/gemini-3-flash,deepseek/deepseek-v4-flash,zai/glm-5.1,minimax/MiniMax-M3" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts

Базовый уровень: вызов инструментов (Read + опциональный Exec)

Выберите как минимум одну модель на каждое семейство провайдеров:

OpenAI: openai/gpt-5.5
Anthropic: anthropic/claude-opus-4-6 (или anthropic/claude-sonnet-4-6)
Google: google/gemini-3-flash-preview (или google/gemini-3.1-pro-preview)
DeepSeek: deepseek/deepseek-v4-flash
Z.AI (GLM): zai/glm-5.1 (общий API) или zai/glm-5.2 (Coding Plan)
MiniMax: minimax/MiniMax-M3

Опциональное дополнительное покрытие (желательно):

xAI: xai/grok-4.3 (или последняя доступная)
Mistral: mistral/… (выберите одну поддерживающую “tools” модель, которая у вас включена)
Cerebras: cerebras/… (если у вас есть доступ)
LM Studio: lmstudio/… (локально; вызов инструментов зависит от режима API)

Vision: отправка изображения (вложение → мультимодальное сообщение)

Включите как минимум одну модель с поддержкой изображений в OPENCLAW_LIVE_GATEWAY_MODELS (варианты Claude/Gemini/OpenAI с поддержкой vision и т. д.), чтобы выполнить проверку изображения.

Агрегаторы / альтернативные Gateway

Если у вас включены ключи, мы также поддерживаем тестирование через:

OpenRouter: openrouter/... (сотни моделей; используйте openclaw models scan, чтобы найти кандидатов с поддержкой инструментов+изображений)
OpenCode: opencode/... для Zen и opencode-go/... для Go (аутентификация через OPENCODE_API_KEY / OPENCODE_ZEN_API_KEY)

Другие провайдеры, которых можно включить в live-матрицу (если у вас есть учетные данные/конфигурация):

Встроенные: openai, anthropic, google, google-vertex, google-antigravity, google-gemini-cli, zai, openrouter, opencode, opencode-go, xai, groq, cerebras, mistral, github-copilot
Через models.providers (пользовательские конечные точки): minimax (облако/API), а также любой OpenAI/Anthropic-совместимый прокси (LM Studio, vLLM, LiteLLM и т. д.)

Не прописывайте жестко «все модели» в документации. Авторитетный список — это то, что discoverModels(...) возвращает на вашей машине, плюс все доступные ключи.

Учетные данные (никогда не коммитьте)

Живые тесты обнаруживают учетные данные так же, как это делает CLI. Практические следствия:

Если CLI работает, живые тесты должны найти те же ключи.
Если живой тест сообщает «нет учетных данных», отлаживайте это так же, как вы отлаживали бы openclaw models list / выбор модели.
Профили аутентификации для каждого агента: ~/.openclaw/agents/<agentId>/agent/auth-profiles.json (именно это означает «ключи профиля» в живых тестах)
Конфигурация: ~/.openclaw/openclaw.json (или OPENCLAW_CONFIG_PATH)
Устаревший каталог состояния: ~/.openclaw/credentials/ (копируется в подготовленный живой домашний каталог при наличии, но не является основным хранилищем ключей профилей)
Локальные живые запуски по умолчанию копируют активную конфигурацию, файлы auth-profiles.json для каждого агента, устаревший credentials/ и поддерживаемые внешние каталоги аутентификации CLI во временный тестовый домашний каталог; подготовленные живые домашние каталоги пропускают workspace/ и sandboxes/, а переопределения путей agents.*.workspace / agentDir удаляются, чтобы проверки не попадали в ваше реальное рабочее пространство на хосте.

Если вы хотите полагаться на ключи из окружения, экспортируйте их перед локальными тестами или используйте Docker-запускатели ниже с явным OPENCLAW_PROFILE_FILE.

Deepgram live (транскрибация аудио)

Тест: extensions/deepgram/audio.live.test.ts
Включение: DEEPGRAM_API_KEY=... DEEPGRAM_LIVE_TEST=1 pnpm test:live extensions/deepgram/audio.live.test.ts

Живой тест плана кодирования BytePlus

Тест: extensions/byteplus/live.test.ts
Включение: BYTEPLUS_API_KEY=... BYTEPLUS_LIVE_TEST=1 pnpm test:live extensions/byteplus/live.test.ts
Необязательное переопределение модели: BYTEPLUS_CODING_MODEL=ark-code-latest

Живой тест медиа для workflow ComfyUI

Тест: extensions/comfy/comfy.live.test.ts
Включение: OPENCLAW_LIVE_TEST=1 COMFY_LIVE_TEST=1 pnpm test:live -- extensions/comfy/comfy.live.test.ts
Область:
- Проверяет встроенные пути comfy для изображений, видео и music_generate
- Пропускает каждую возможность, если plugins.entries.comfy.config.<capability> не настроен
- Полезно после изменений отправки workflow comfy, polling, загрузок или регистрации Plugin

Живой тест генерации изображений

Тест: test/image-generation.runtime.live.test.ts
Команда: pnpm test:live test/image-generation.runtime.live.test.ts
Оснастка: pnpm test:live:media image
Область:
- Перечисляет каждый зарегистрированный provider plugin для генерации изображений
- Использует уже экспортированные переменные окружения провайдера перед проверкой
- По умолчанию использует live/env API-ключи раньше сохраненных профилей аутентификации, поэтому устаревшие тестовые ключи в auth-profiles.json не скрывают реальные учетные данные shell
- Пропускает провайдеры без пригодной аутентификации/профиля/модели
- Прогоняет каждый настроенный провайдер через общий runtime генерации изображений:
  - <provider>:generate
  - <provider>:edit, когда провайдер объявляет поддержку редактирования
Текущие покрытые встроенные провайдеры:
- deepinfra
- fal
- google
- minimax
- openai
- openrouter
- vydra
- xai
Необязательное сужение:
- OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS="openai,google,openrouter,xai"
- OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS="deepinfra"
- OPENCLAW_LIVE_IMAGE_GENERATION_MODELS="openai/gpt-image-2,google/gemini-3.1-flash-image-preview,openrouter/google/gemini-3.1-flash-image-preview,xai/grok-imagine-image"
- OPENCLAW_LIVE_IMAGE_GENERATION_CASES="google:flash-generate,google:pro-edit,openrouter:generate,xai:default-generate,xai:default-edit"
Необязательное поведение аутентификации:
- OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1, чтобы принудительно использовать аутентификацию из хранилища профилей и игнорировать переопределения только из окружения

Для поставляемого пути CLI добавьте smoke-тест infer после успешного прохождения живого теста provider/runtime:

OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_INFER_CLI_TEST=1 pnpm test:live -- test/image-generation.infer-cli.live.test.ts
openclaw infer image providers --json
openclaw infer image generate \
  --model google/gemini-3.1-flash-image-preview \
  --prompt "Minimal flat test image: one blue square on a white background, no text." \
  --output ./openclaw-infer-image-smoke.png \
  --json

Это покрывает разбор аргументов CLI, разрешение конфигурации/default-agent, активацию встроенного Plugin, общий runtime генерации изображений и живой запрос к провайдеру. Ожидается, что зависимости Plugin присутствуют до загрузки runtime.

Живой тест генерации музыки

Тест: extensions/music-generation-providers.live.test.ts
Включение: OPENCLAW_LIVE_TEST=1 pnpm test:live -- extensions/music-generation-providers.live.test.ts
Оснастка: pnpm test:live:media music
Область:
- Проверяет общий путь встроенного провайдера генерации музыки
- В настоящее время покрывает Google и MiniMax
- Использует уже экспортированные переменные окружения провайдера перед проверкой
- По умолчанию использует live/env API-ключи раньше сохраненных профилей аутентификации, поэтому устаревшие тестовые ключи в auth-profiles.json не скрывают реальные учетные данные shell
- Пропускает провайдеры без пригодной аутентификации/профиля/модели
- Запускает оба объявленных режима runtime, когда они доступны:
  - generate с вводом только prompt
  - edit, когда провайдер объявляет capabilities.edit.enabled
- Текущее покрытие общего lane:
  - google: generate, edit
  - minimax: generate
  - comfy: отдельный живой файл Comfy, не этот общий sweep
Необязательное сужение:
- OPENCLAW_LIVE_MUSIC_GENERATION_PROVIDERS="google,minimax"
- OPENCLAW_LIVE_MUSIC_GENERATION_MODELS="google/lyria-3-clip-preview,minimax/music-2.6"
Необязательное поведение аутентификации:
- OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1, чтобы принудительно использовать аутентификацию из хранилища профилей и игнорировать переопределения только из окружения

Живой тест генерации видео

Тест: extensions/video-generation-providers.live.test.ts
Включение: OPENCLAW_LIVE_TEST=1 pnpm test:live -- extensions/video-generation-providers.live.test.ts
Оснастка: pnpm test:live:media video
Область:
- Проверяет общий путь встроенного провайдера генерации видео
- По умолчанию использует release-safe smoke-путь: провайдеры не FAL, один text-to-video запрос на провайдера, prompt с омаром на одну секунду и лимит операции на провайдера из OPENCLAW_LIVE_VIDEO_GENERATION_TIMEOUT_MS (180000 по умолчанию)
- По умолчанию пропускает FAL, потому что задержка очереди на стороне провайдера может доминировать во времени релиза; передайте --video-providers fal или OPENCLAW_LIVE_VIDEO_GENERATION_PROVIDERS="fal", чтобы запустить его явно
- Использует уже экспортированные переменные окружения провайдера перед проверкой
- По умолчанию использует live/env API-ключи раньше сохраненных профилей аутентификации, поэтому устаревшие тестовые ключи в auth-profiles.json не скрывают реальные учетные данные shell
- Пропускает провайдеры без пригодной аутентификации/профиля/модели
- По умолчанию запускает только generate
- Установите OPENCLAW_LIVE_VIDEO_GENERATION_FULL_MODES=1, чтобы также запускать объявленные режимы transform, когда они доступны:
  - imageToVideo, когда провайдер объявляет capabilities.imageToVideo.enabled, а выбранный провайдер/модель принимает локальный ввод изображения на основе буфера в общем sweep
  - videoToVideo, когда провайдер объявляет capabilities.videoToVideo.enabled, а выбранный провайдер/модель принимает локальный ввод видео на основе буфера в общем sweep
- Текущие объявленные, но пропускаемые провайдеры imageToVideo в общем sweep:
  - vydra, потому что встроенный veo3 поддерживает только текст, а встроенный kling требует удаленный URL изображения
- Покрытие Vydra для конкретного провайдера:
  - OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_VYDRA_VIDEO=1 pnpm test:live -- extensions/vydra/vydra.live.test.ts
  - этот файл запускает veo3 text-to-video плюс lane kling, который по умолчанию использует фикстуру с удаленным URL изображения
- Текущее живое покрытие videoToVideo:
  - только runway, когда выбранная модель — runway/gen4_aleph
- Текущие объявленные, но пропускаемые провайдеры videoToVideo в общем sweep:
  - alibaba, qwen, xai, потому что эти пути сейчас требуют удаленные эталонные URL http(s) / MP4
  - google, потому что текущий общий lane Gemini/Veo использует локальный ввод на основе буфера, а этот путь не принимается в общем sweep
  - openai, потому что текущему общему lane не хватает гарантий доступа к редактированию видео, зависящих от организации
Необязательное сужение:
- OPENCLAW_LIVE_VIDEO_GENERATION_PROVIDERS="deepinfra,google,openai,runway"
- OPENCLAW_LIVE_VIDEO_GENERATION_MODELS="google/veo-3.1-fast-generate-preview,openai/sora-2,runway/gen4_aleph"
- OPENCLAW_LIVE_VIDEO_GENERATION_SKIP_PROVIDERS="", чтобы включить каждого провайдера в sweep по умолчанию, включая FAL
- OPENCLAW_LIVE_VIDEO_GENERATION_TIMEOUT_MS=60000, чтобы уменьшить лимит каждой операции провайдера для агрессивного smoke-запуска
Необязательное поведение аутентификации:
- OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1, чтобы принудительно использовать аутентификацию из хранилища профилей и игнорировать переопределения только из окружения

Живая media-оснастка

Команда: pnpm test:live:media
Назначение:
- Запускает общие живые наборы тестов изображений, музыки и видео через одну repo-native точку входа
- Использует уже экспортированные переменные окружения провайдера
- По умолчанию автоматически сужает каждый набор до провайдеров, для которых сейчас есть пригодная аутентификация
- Повторно использует scripts/test-live.mjs, поэтому поведение Heartbeat и quiet-mode остается согласованным
Примеры:
- pnpm test:live:media
- pnpm test:live:media image video --providers openai,google,minimax
- pnpm test:live:media video --video-providers openai,runway --all-providers
- pnpm test:live:media music --quiet

Связанные материалы

Тестирование - unit, integration, QA и Docker-наборы

​Live: локальные smoke-команды

​Live: проверка возможностей Android-узла

​Live: model smoke (ключи профилей)

​Уровень 1: прямое completion модели (без Gateway)

​Уровень 2: Gateway + smoke dev-агента (что на самом деле делает “@openclaw”)

​Live: smoke CLI-бэкенда (Claude, Gemini или другие локальные CLI)

​Live: достижимость APNs HTTP/2 proxy

​Live: ACP bind smoke (/acp spawn ... --bind here)

​Live: smoke harness Codex app-server

​Рекомендуемые live-рецепты

​Live: матрица моделей (что мы покрываем)

​Современный smoke-набор (вызов инструментов + изображение)

​Базовый уровень: вызов инструментов (Read + опциональный Exec)

​Vision: отправка изображения (вложение → мультимодальное сообщение)

​Агрегаторы / альтернативные Gateway

​Учетные данные (никогда не коммитьте)

​Deepgram live (транскрибация аудио)

​Живой тест плана кодирования BytePlus

​Живой тест медиа для workflow ComfyUI

​Живой тест генерации изображений

​Живой тест генерации музыки

​Живой тест генерации видео

​Живая media-оснастка

​Связанные материалы

Live: локальные smoke-команды

Live: проверка возможностей Android-узла

Live: model smoke (ключи профилей)

Уровень 1: прямое completion модели (без Gateway)

Уровень 2: Gateway + smoke dev-агента (что на самом деле делает “@openclaw”)

Live: smoke CLI-бэкенда (Claude, Gemini или другие локальные CLI)

Live: достижимость APNs HTTP/2 proxy

Live: ACP bind smoke (`/acp spawn ... --bind here`)

Live: smoke harness Codex app-server

Рекомендуемые live-рецепты

Live: матрица моделей (что мы покрываем)

Современный smoke-набор (вызов инструментов + изображение)

Базовый уровень: вызов инструментов (Read + опциональный Exec)

Vision: отправка изображения (вложение → мультимодальное сообщение)

Агрегаторы / альтернативные Gateway

Учетные данные (никогда не коммитьте)

Deepgram live (транскрибация аудио)

Живой тест плана кодирования BytePlus

Живой тест медиа для workflow ComfyUI

Живой тест генерации изображений

Живой тест генерации музыки

Живой тест генерации видео

Живая media-оснастка

Связанные материалы