> ## Documentation Index
> Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
> Use this file to discover all available pages before exploring further.

# Тестирование: live-наборы

Для быстрого старта, QA-раннеров, наборов unit/integration-тестов и Docker-потоков см.
[Тестирование](/ru/help/testing). Эта страница описывает **live**-наборы тестов
(затрагивающие сеть): матрицу моделей, CLI-бэкенды, ACP и live-тесты
медиапровайдеров, а также работу с учетными данными.

## Live: локальные smoke-команды

Перед разовыми live-проверками экспортируйте нужный ключ провайдера в окружение
процесса.

Безопасный media-smoke:

```bash theme={"theme":{"light":"min-light","dark":"min-dark"}}
pnpm openclaw infer tts convert --local --json \
  --text "OpenClaw live smoke." \
  --output /tmp/openclaw-live-smoke.mp3
```

Безопасный smoke готовности голосового вызова:

```bash theme={"theme":{"light":"min-light","dark":"min-dark"}}
pnpm openclaw voicecall setup --json
pnpm openclaw voicecall smoke --to "+15555550123"
```

`voicecall smoke` выполняет пробный прогон, если также не указан `--yes`.
Используйте `--yes` только когда вы намеренно хотите выполнить реальный
уведомительный звонок. Для Twilio, Telnyx и Plivo успешная проверка готовности
требует публичный URL Webhook; локальные loopback/приватные fallback-варианты
отклоняются намеренно.

## Live: проверка возможностей Android-узла

* Тест: `src/gateway/android-node.capabilities.live.test.ts`
* Скрипт: `pnpm android:test:integration`
* Цель: вызвать **каждую команду, объявляемую сейчас** подключенным Android-узлом, и проверить поведение контракта команды.
* Область:
  * Предварительная/ручная настройка (набор тестов не устанавливает, не запускает и не сопрягает приложение).
  * Проверка gateway `node.invoke` команда за командой для выбранного Android-узла.
* Обязательная предварительная настройка:
  * Android-приложение уже подключено и сопряжено с Gateway.
  * Приложение удерживается на переднем плане.
  * Разрешения/согласие на захват предоставлены для возможностей, которые должны проходить.
* Необязательные переопределения цели:
  * `OPENCLAW_ANDROID_NODE_ID` или `OPENCLAW_ANDROID_NODE_NAME`.
  * `OPENCLAW_ANDROID_GATEWAY_URL` / `OPENCLAW_ANDROID_GATEWAY_TOKEN` / `OPENCLAW_ANDROID_GATEWAY_PASSWORD`.
* Полные сведения о настройке Android: [Android-приложение](/ru/platforms/android)

## Live: model smoke (ключи профилей)

Live-тесты разделены на два уровня, чтобы мы могли изолировать сбои:

* «Прямая модель» показывает, что провайдер/модель вообще может ответить с данным ключом.
* «Gateway smoke» показывает, что для этой модели работает весь конвейер gateway+agent (сессии, история, инструменты, sandbox-политика и т. д.).

### Уровень 1: прямое completion модели (без Gateway)

* Тест: `src/agents/models.profiles.live.test.ts`
* Цель:
  * Перечислить обнаруженные модели
  * Использовать `getApiKeyForModel`, чтобы выбрать модели, для которых у вас есть учетные данные
  * Запустить небольшое completion для каждой модели (и точечные регрессии там, где нужно)
* Как включить:
  * `pnpm test:live` (или `OPENCLAW_LIVE_TEST=1`, если вызываете Vitest напрямую)
* Установите `OPENCLAW_LIVE_MODELS=modern`, `small` или `all` (алиас для modern), чтобы действительно запустить этот набор; иначе он пропускается, чтобы `pnpm test:live` оставался сосредоточен на gateway smoke
* Как выбрать модели:
  * `OPENCLAW_LIVE_MODELS=modern`, чтобы запустить современный allowlist (Opus/Sonnet 4.6+, GPT-5.2 + Codex, Gemini 3, DeepSeek V4, GLM 5.1, MiniMax M3, Grok 4.3)
  * `OPENCLAW_LIVE_MODELS=small`, чтобы запустить ограниченный allowlist малых моделей (локально совместимые маршруты Qwen 8B/9B, Ollama Gemma, OpenRouter Qwen/GLM и Z.AI GLM)
  * `OPENCLAW_LIVE_MODELS=all` — алиас для современного allowlist
  * или `OPENCLAW_LIVE_MODELS="openai/gpt-5.5,anthropic/claude-opus-4-6,..."` (allowlist через запятую)
  * Локальные запуски малых моделей Ollama по умолчанию используют `http://127.0.0.1:11434`; задавайте `OPENCLAW_LIVE_OLLAMA_BASE_URL` только для LAN, пользовательских endpoint-ов или Ollama Cloud.
  * Проверки modern/all и small по умолчанию используют свои курируемые лимиты; задайте `OPENCLAW_LIVE_MAX_MODELS=0` для исчерпывающей проверки выбранного профиля или положительное число для меньшего лимита.
  * Исчерпывающие проверки используют `OPENCLAW_LIVE_TEST_TIMEOUT_MS` как timeout всего прямого теста моделей. По умолчанию: 60 минут.
  * Пробы прямых моделей по умолчанию выполняются с параллелизмом 20; задайте `OPENCLAW_LIVE_MODEL_CONCURRENCY`, чтобы переопределить.
* Как выбрать провайдеров:
  * `OPENCLAW_LIVE_PROVIDERS="google,google-antigravity,google-gemini-cli"` (allowlist через запятую)
* Откуда берутся ключи:
  * По умолчанию: хранилище профилей и fallback-значения окружения
  * Задайте `OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1`, чтобы принудительно использовать только **хранилище профилей**
* Зачем это существует:
  * Отделяет «API провайдера сломан / ключ недействителен» от «конвейер gateway agent сломан»
  * Содержит небольшие изолированные регрессии (пример: reasoning replay OpenAI Responses/Codex Responses + потоки tool-call)

### Уровень 2: Gateway + smoke dev-агента (что на самом деле делает "@openclaw")

* Тест: `src/gateway/gateway-models.profiles.live.test.ts`
* Цель:
  * Запустить внутрипроцессный Gateway
  * Создать/пропатчить сессию `agent:dev:*` (переопределение модели для каждого запуска)
  * Перебрать модели с ключами и проверить:
    * «содержательный» ответ (без инструментов)
    * реальный вызов инструмента работает (проба чтения)
    * необязательные дополнительные пробы инструментов (проба exec+read)
    * регрессионные пути OpenAI (только tool-call → follow-up) продолжают работать
* Детали проб (чтобы быстро объяснять сбои):
  * Проба `read`: тест записывает nonce-файл в workspace и просит агента `read` его и вернуть nonce в ответе.
  * Проба `exec+read`: тест просит агента через `exec` записать nonce во временный файл, затем прочитать его через `read`.
  * Проба изображения: тест прикрепляет сгенерированный PNG (cat + рандомизированный код) и ожидает, что модель вернет `cat <CODE>`.
  * Ссылка на реализацию: `src/gateway/gateway-models.profiles.live.test.ts` и `test/helpers/live-image-probe.ts`.
* Как включить:
  * `pnpm test:live` (или `OPENCLAW_LIVE_TEST=1`, если вызываете Vitest напрямую)
* Как выбрать модели:
  * По умолчанию: современный allowlist (Opus/Sonnet 4.6+, GPT-5.2 + Codex, Gemini 3, DeepSeek V4, GLM 4.7, MiniMax M3, Grok 4.3)
  * `OPENCLAW_LIVE_GATEWAY_MODELS=small`, чтобы прогнать тот же ограниченный allowlist малых моделей через полный конвейер gateway+agent
  * `OPENCLAW_LIVE_GATEWAY_MODELS=all` — алиас для современного allowlist
  * Или задайте `OPENCLAW_LIVE_GATEWAY_MODELS="provider/model"` (или список через запятую), чтобы сузить выбор
  * Проверки gateway modern/all и small по умолчанию используют свои курируемые лимиты; задайте `OPENCLAW_LIVE_GATEWAY_MAX_MODELS=0` для исчерпывающей выбранной проверки или положительное число для меньшего лимита.
* Как выбрать провайдеров (избежать «весь OpenRouter»):
  * `OPENCLAW_LIVE_GATEWAY_PROVIDERS="google,google-antigravity,google-gemini-cli,openai,anthropic,zai,minimax"` (allowlist через запятую)
* Пробы инструментов и изображений всегда включены в этом live-тесте:
  * Проба `read` + проба `exec+read` (нагрузка на инструменты)
  * Проба изображения запускается, когда модель объявляет поддержку входных изображений
  * Поток (верхнеуровнево):
    * Тест генерирует крошечный PNG с "CAT" + случайным кодом (`test/helpers/live-image-probe.ts`)
    * Отправляет его через `agent` `attachments: [{ mimeType: "image/png", content: "<base64>" }]`
    * Gateway разбирает вложения в `images[]` (`src/gateway/server-methods/agent.ts` + `src/gateway/chat-attachments.ts`)
    * Встроенный агент пересылает мультимодальное пользовательское сообщение модели
    * Проверка: ответ содержит `cat` + код (допуск OCR: разрешены небольшие ошибки)

<Tip>
  Чтобы увидеть, что можно тестировать на вашей машине (и точные id `provider/model`), выполните:

  ```bash theme={"theme":{"light":"min-light","dark":"min-dark"}}
  openclaw models list
  openclaw models list --json
  ```
</Tip>

## Live: smoke CLI-бэкенда (Claude, Gemini или другие локальные CLI)

* Тест: `src/gateway/gateway-cli-backend.live.test.ts`
* Цель: проверить конвейер Gateway + agent с использованием локального CLI-бэкенда, не затрагивая вашу конфигурацию по умолчанию.
* Специфичные для бэкенда значения smoke по умолчанию находятся в определении `cli-backend.ts` владеющего Plugin.
* Включение:
  * `pnpm test:live` (или `OPENCLAW_LIVE_TEST=1`, если вызываете Vitest напрямую)
  * `OPENCLAW_LIVE_CLI_BACKEND=1`
* Значения по умолчанию:
  * Провайдер/модель по умолчанию: `claude-cli/claude-sonnet-4-6`
  * Поведение команды/аргументов/изображений берется из метаданных владеющего CLI backend Plugin.
* Переопределения (необязательно):
  * `OPENCLAW_LIVE_CLI_BACKEND_MODEL="claude-cli/claude-sonnet-4-6"`
  * `OPENCLAW_LIVE_CLI_BACKEND_COMMAND="/full/path/to/claude"`
  * `OPENCLAW_LIVE_CLI_BACKEND_ARGS='["-p","--output-format","json"]'`
  * `OPENCLAW_LIVE_CLI_BACKEND_IMAGE_PROBE=1`, чтобы отправить реальное вложение-изображение (пути внедряются в prompt). Docker-рецепты по умолчанию отключают это, если явно не запрошено.
  * `OPENCLAW_LIVE_CLI_BACKEND_IMAGE_ARG="--image"`, чтобы передавать пути к файлам изображений как CLI-аргументы вместо внедрения в prompt.
  * `OPENCLAW_LIVE_CLI_BACKEND_IMAGE_MODE="repeat"` (или `"list"`), чтобы управлять тем, как передаются аргументы изображений при заданном `IMAGE_ARG`.
  * `OPENCLAW_LIVE_CLI_BACKEND_RESUME_PROBE=1`, чтобы отправить второй ход и проверить поток resume.
  * `OPENCLAW_LIVE_CLI_BACKEND_MODEL_SWITCH_PROBE=1`, чтобы включить пробу непрерывности Claude Sonnet -> Opus в той же сессии, когда выбранная модель поддерживает целевое переключение. Docker-рецепты по умолчанию отключают это для общей надежности.
  * `OPENCLAW_LIVE_CLI_BACKEND_MCP_PROBE=1`, чтобы включить пробу loopback MCP/инструментов. Docker-рецепты по умолчанию отключают это, если явно не запрошено.

Пример:

```bash theme={"theme":{"light":"min-light","dark":"min-dark"}}
  OPENCLAW_LIVE_CLI_BACKEND=1 \
  OPENCLAW_LIVE_CLI_BACKEND_MODEL="claude-cli/claude-sonnet-4-6" \
  pnpm test:live src/gateway/gateway-cli-backend.live.test.ts
```

Дешевый smoke конфигурации Gemini MCP:

```bash theme={"theme":{"light":"min-light","dark":"min-dark"}}
OPENCLAW_LIVE_TEST=1 \
  pnpm test:live src/agents/cli-runner/bundle-mcp.gemini.live.test.ts
```

Это не просит Gemini генерировать ответ. Он записывает те же системные
настройки, которые OpenClaw передает Gemini, затем выполняет `gemini --debug mcp list`, чтобы доказать, что сохраненный сервер
`transport: "streamable-http"` нормализуется в HTTP MCP-форму Gemini
и может подключиться к локальному streamable-HTTP MCP-серверу.

Docker-рецепт:

```bash theme={"theme":{"light":"min-light","dark":"min-dark"}}
pnpm test:docker:live-cli-backend
```

Docker-рецепты для отдельных провайдеров:

```bash theme={"theme":{"light":"min-light","dark":"min-dark"}}
pnpm test:docker:live-cli-backend:claude
pnpm test:docker:live-cli-backend:claude-subscription
pnpm test:docker:live-cli-backend:gemini
```

Примечания:

* Docker-раннер находится в `scripts/test-live-cli-backend-docker.sh`.
* Он запускает live-smoke CLI-бэкенда внутри Docker-образа репозитория от непривилегированного пользователя `node`.
* Он разрешает CLI smoke-метаданные из владеющего Plugin, затем устанавливает соответствующий Linux CLI-пакет (`@anthropic-ai/claude-code` или `@google/gemini-cli`) в кэшируемый записываемый префикс по `OPENCLAW_DOCKER_CLI_TOOLS_DIR` (по умолчанию: `~/.cache/openclaw/docker-cli-tools`).
* `pnpm test:docker:live-cli-backend:claude-subscription` требует переносимый OAuth подписки Claude Code через `~/.claude/.credentials.json` с `claudeAiOauth.subscriptionType` или `CLAUDE_CODE_OAUTH_TOKEN` из `claude setup-token`. Сначала он доказывает прямой `claude -p` в Docker, затем выполняет два хода Gateway CLI-бэкенда без сохранения env vars API-ключей Anthropic. Эта subscription-линия по умолчанию отключает пробы Claude MCP/инструментов и изображений, потому что она расходует лимиты использования подписки с входом в систему, а Anthropic может менять поведение биллинга и rate-limit для Claude Agent SDK / `claude -p` без релиза OpenClaw.
* Live-smoke CLI-бэкенда теперь выполняет один и тот же сквозной поток для Claude и Gemini: текстовый ход, ход классификации изображения, затем вызов инструмента MCP `cron`, проверенный через gateway CLI.
* Smoke Claude по умолчанию также патчит сессию с Sonnet на Opus и проверяет, что возобновленная сессия все еще помнит более раннюю заметку.

## Live: достижимость APNs HTTP/2 proxy

* Тест: `src/infra/push-apns-http2.live.test.ts`
* Цель: пройти туннелем через локальный HTTP CONNECT proxy к sandbox endpoint Apple APNs, отправить APNs HTTP/2 validation request и проверить, что реальный ответ Apple `403 InvalidProviderToken` возвращается через proxy-путь.
* Включение:
  * `OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_APNS_REACHABILITY=1 pnpm test:live src/infra/push-apns-http2.live.test.ts`
* Необязательный timeout:
  * `OPENCLAW_LIVE_APNS_TIMEOUT_MS=30000`

## Live: ACP bind smoke (`/acp spawn ... --bind here`)

* Тест: `src/gateway/gateway-acp-bind.live.test.ts`
* Цель: проверить реальный поток привязки беседы ACP с live-агентом ACP:
  * отправить `/acp spawn <agent> --bind here`
  * привязать синтетическую беседу канала сообщений на месте
  * отправить обычное последующее сообщение в той же беседе
  * проверить, что последующее сообщение попадает в транскрипт привязанной сессии ACP
* Включение:
  * `pnpm test:live src/gateway/gateway-acp-bind.live.test.ts`
  * `OPENCLAW_LIVE_ACP_BIND=1`
* Значения по умолчанию:
  * агенты ACP в Docker: `claude,codex,gemini`
  * агент ACP для прямого `pnpm test:live ...`: `claude`
  * синтетический канал: контекст беседы в стиле Slack DM
  * бэкенд ACP: `acpx`
* Переопределения:
  * `OPENCLAW_LIVE_ACP_BIND_AGENT=claude`
  * `OPENCLAW_LIVE_ACP_BIND_AGENT=codex`
  * `OPENCLAW_LIVE_ACP_BIND_AGENT=droid`
  * `OPENCLAW_LIVE_ACP_BIND_AGENT=gemini`
  * `OPENCLAW_LIVE_ACP_BIND_AGENT=opencode`
  * `OPENCLAW_LIVE_ACP_BIND_AGENTS=claude,codex,gemini`
  * `OPENCLAW_LIVE_ACP_BIND_AGENT_COMMAND='npx -y @agentclientprotocol/claude-agent-acp@<version>'`
  * `OPENCLAW_LIVE_ACP_BIND_CODEX_MODEL=gpt-5.5`
  * `OPENCLAW_LIVE_ACP_BIND_OPENCODE_MODEL=opencode/kimi-k2.6`
  * `OPENCLAW_LIVE_ACP_BIND_REQUIRE_TRANSCRIPT=1`
  * `OPENCLAW_LIVE_ACP_BIND_REQUIRE_CRON=1`
  * `OPENCLAW_LIVE_ACP_BIND_PARENT_MODEL=openai/gpt-5.5`
* Примечания:
  * Этот lane использует поверхность Gateway `chat.send` с синтетическими полями исходного маршрута только для администраторов, чтобы тесты могли присоединять контекст канала сообщений, не имитируя внешнюю доставку.
  * Когда `OPENCLAW_LIVE_ACP_BIND_AGENT_COMMAND` не задан, тест использует встроенный реестр агентов встроенного Plugin `acpx` для выбранного агента ACP harness.
  * Создание MCP для Cron привязанной сессии по умолчанию выполняется по принципу best-effort, потому что внешние ACP harness могут отменять вызовы MCP после прохождения проверки привязки/изображения; задайте `OPENCLAW_LIVE_ACP_BIND_REQUIRE_CRON=1`, чтобы сделать эту проверку Cron после привязки строгой.

Пример:

```bash theme={"theme":{"light":"min-light","dark":"min-dark"}}
OPENCLAW_LIVE_ACP_BIND=1 \
  OPENCLAW_LIVE_ACP_BIND_AGENT=claude \
  pnpm test:live src/gateway/gateway-acp-bind.live.test.ts
```

Рецепт Docker:

```bash theme={"theme":{"light":"min-light","dark":"min-dark"}}
pnpm test:docker:live-acp-bind
```

Рецепты Docker для одного агента:

```bash theme={"theme":{"light":"min-light","dark":"min-dark"}}
pnpm test:docker:live-acp-bind:claude
pnpm test:docker:live-acp-bind:codex
pnpm test:docker:live-acp-bind:droid
pnpm test:docker:live-acp-bind:gemini
pnpm test:docker:live-acp-bind:opencode
```

Примечания Docker:

* Docker runner находится в `scripts/test-live-acp-bind-docker.sh`.
* По умолчанию он последовательно запускает smoke привязки ACP для агрегированных live-агентов CLI: `claude`, `codex`, затем `gemini`.
* Используйте `OPENCLAW_LIVE_ACP_BIND_AGENTS=claude`, `OPENCLAW_LIVE_ACP_BIND_AGENTS=codex`, `OPENCLAW_LIVE_ACP_BIND_AGENTS=droid`, `OPENCLAW_LIVE_ACP_BIND_AGENTS=gemini` или `OPENCLAW_LIVE_ACP_BIND_AGENTS=opencode`, чтобы сузить матрицу.
* Он подготавливает соответствующие материалы аутентификации CLI в контейнере, затем устанавливает запрошенный live CLI (`@anthropic-ai/claude-code`, `@openai/codex`, Factory Droid через `https://app.factory.ai/cli`, `@google/gemini-cli` или `opencode-ai`), если он отсутствует. Сам бэкенд ACP — встроенный пакет `acpx/runtime` из официального Plugin `acpx`.
* Вариант Droid Docker подготавливает `~/.factory` для настроек, пробрасывает `FACTORY_API_KEY` и требует этот ключ API, потому что локальная аутентификация Factory OAuth/keyring непереносима в контейнер. Он использует встроенную запись реестра ACPX `droid exec --output-format acp`.
* Вариант OpenCode Docker — строгий regression lane для одного агента. Он записывает временную модель по умолчанию `OPENCODE_CONFIG_CONTENT` из `OPENCLAW_LIVE_ACP_BIND_OPENCODE_MODEL` (по умолчанию `opencode/kimi-k2.6`), а `pnpm test:docker:live-acp-bind:opencode` требует транскрипт привязанного assistant вместо принятия общего пропуска после привязки.
* Прямые вызовы CLI `acpx` — только ручной путь/обходной путь для сравнения поведения вне Gateway. Smoke привязки Docker ACP проверяет встроенный runtime-бэкенд `acpx` OpenClaw.

## Live: smoke harness Codex app-server

* Цель: проверить принадлежащий Plugin harness Codex через обычный метод Gateway
  `agent`:
  * загрузить bundled Plugin `codex`
  * выбрать `openai/gpt-5.5`, который по умолчанию маршрутизирует агентские ходы OpenAI через Codex
  * отправить первый агентский ход Gateway в `openai/gpt-5.5` с выбранным harness Codex
  * отправить второй ход в ту же сессию OpenClaw и проверить, что thread app-server
    может возобновиться
  * выполнить `/codex status` и `/codex models` через тот же путь команд Gateway
  * опционально выполнить две проверенные Guardian shell-проверки с повышенными правами: одну безвредную
    команду, которая должна быть одобрена, и одну загрузку fake-secret, которая должна быть
    отклонена, чтобы агент задал уточняющий вопрос
* Тест: `src/gateway/gateway-codex-harness.live.test.ts`
* Включение: `OPENCLAW_LIVE_CODEX_HARNESS=1`
* Модель по умолчанию: `openai/gpt-5.5`
* Опциональная проверка изображения: `OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=1`
* Опциональная проверка MCP/инструмента: `OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=1`
* Опциональная проверка Guardian: `OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=1`
* Smoke принудительно задает provider/model `agentRuntime.id: "codex"`, чтобы сломанный harness Codex
  не мог пройти за счет тихого fallback к OpenClaw.
* Аутентификация: аутентификация Codex app-server из локального входа по подписке Codex. Docker
  smokes также могут предоставлять `OPENAI_API_KEY` для не-Codex проверок, когда применимо,
  а также опционально скопированные `~/.codex/auth.json` и `~/.codex/config.toml`.

Локальный рецепт:

```bash theme={"theme":{"light":"min-light","dark":"min-dark"}}
OPENCLAW_LIVE_CODEX_HARNESS=1 \
  OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=1 \
  OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=1 \
  OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=1 \
  OPENCLAW_LIVE_CODEX_HARNESS_MODEL=openai/gpt-5.5 \
  pnpm test:live -- src/gateway/gateway-codex-harness.live.test.ts
```

Рецепт Docker:

```bash theme={"theme":{"light":"min-light","dark":"min-dark"}}
pnpm test:docker:live-codex-harness
```

Примечания Docker:

* Docker runner находится в `scripts/test-live-codex-harness-docker.sh`.
* Он передает `OPENAI_API_KEY`, копирует файлы аутентификации Codex CLI при наличии, устанавливает
  `@openai/codex` в доступный для записи смонтированный npm
  prefix, подготавливает дерево исходного кода, затем запускает только live-тест Codex-harness.
* Docker по умолчанию включает проверки изображения, MCP/инструмента и Guardian. Задайте
  `OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=0` или
  `OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=0` или
  `OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=0`, когда нужен более узкий отладочный
  запуск.
* Docker использует ту же явную конфигурацию runtime Codex, поэтому legacy alias или fallback OpenClaw
  не могут скрыть регрессию harness Codex.

### Рекомендуемые live-рецепты

Узкие, явные allowlists быстрее всего и наименее нестабильны:

* Одна модель, напрямую (без Gateway):
  * `OPENCLAW_LIVE_MODELS="openai/gpt-5.5" pnpm test:live src/agents/models.profiles.live.test.ts`

* Прямой профиль small-model:
  * `OPENCLAW_LIVE_MODELS=small pnpm test:live src/agents/models.profiles.live.test.ts`

* Профиль small-model через Gateway:
  * `OPENCLAW_LIVE_GATEWAY_MODELS=small pnpm test:live src/gateway/gateway-models.profiles.live.test.ts`

* Smoke Ollama Cloud API:
  * `OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_OLLAMA=1 OPENCLAW_LIVE_OLLAMA_BASE_URL=https://ollama.com OPENCLAW_LIVE_OLLAMA_MODEL=glm-5.1:cloud OPENCLAW_LIVE_OLLAMA_WEB_SEARCH=0 pnpm test:live -- extensions/ollama/ollama.live.test.ts`

* Одна модель, smoke через Gateway:
  * `OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts`

* Вызов инструментов у нескольких провайдеров:
  * `OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5,anthropic/claude-opus-4-6,google/gemini-3-flash-preview,deepseek/deepseek-v4-flash,zai/glm-5.1,minimax/MiniMax-M3" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts`

* Прямой smoke Z.AI Coding Plan GLM-5.2:
  * `ZAI_CODING_LIVE_TEST=1 pnpm test:live src/agents/zai.live.test.ts`

* Фокус Google (ключ Gemini API + Antigravity):
  * Gemini (ключ API): `OPENCLAW_LIVE_GATEWAY_MODELS="google/gemini-3-flash-preview" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts`
  * Antigravity (OAuth): `OPENCLAW_LIVE_GATEWAY_MODELS="google-antigravity/claude-opus-4-6-thinking,google-antigravity/gemini-3-pro-high" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts`

* Smoke Google adaptive thinking:
  * Gemini 3 dynamic по умолчанию: `pnpm openclaw qa manual --provider-mode live-frontier --model google/gemini-3.1-pro-preview --alt-model google/gemini-3.1-pro-preview --message '/think adaptive Reply exactly: GEMINI_ADAPTIVE_OK' --timeout-ms 180000`
  * Gemini 2.5 dynamic budget: `pnpm openclaw qa manual --provider-mode live-frontier --model google/gemini-2.5-flash --alt-model google/gemini-2.5-flash --message '/think adaptive Reply exactly: GEMINI25_ADAPTIVE_OK' --timeout-ms 180000`

Примечания:

* `google/...` использует Gemini API (ключ API).
* `google-antigravity/...` использует мост Antigravity OAuth (agent endpoint в стиле Cloud Code Assist).
* `google-gemini-cli/...` использует локальный Gemini CLI на вашей машине (отдельная аутентификация + особенности инструментов).
* Gemini API и Gemini CLI:
  * API: OpenClaw вызывает размещенный Google Gemini API по HTTP (ключ API / аутентификация профиля); именно это большинство пользователей подразумевает под "Gemini".
  * CLI: OpenClaw запускает локальный бинарный файл `gemini`; у него собственная аутентификация, и он может вести себя иначе (поддержка streaming/инструментов/расхождение версий).

## Live: матрица моделей (что мы покрываем)

Фиксированного "списка моделей CI" нет (live включается явно), но это **рекомендуемые** модели для регулярного покрытия на dev-машине с ключами.

### Современный smoke-набор (вызов инструментов + изображение)

Это запуск "common models", который, как ожидается, должен продолжать работать:

* OpenAI (не Codex): `openai/gpt-5.5`
* OpenAI ChatGPT/Codex OAuth: `openai/gpt-5.5`
* Anthropic: `anthropic/claude-opus-4-6` (или `anthropic/claude-sonnet-4-6`)
* Google (Gemini API): `google/gemini-3.1-pro-preview` и `google/gemini-3-flash-preview` (избегайте более старых моделей Gemini 2.x)
* Google (Antigravity): `google-antigravity/claude-opus-4-6-thinking` и `google-antigravity/gemini-3-flash`
* DeepSeek: `deepseek/deepseek-v4-flash` и `deepseek/deepseek-v4-pro`
* Z.AI (GLM): `zai/glm-5.1` (общий API) или `zai/glm-5.2` (Coding Plan)
* MiniMax: `minimax/MiniMax-M3`

Запустите smoke Gateway с инструментами + изображением:
`OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5,anthropic/claude-opus-4-6,google/gemini-3.1-pro-preview,google/gemini-3-flash-preview,google-antigravity/claude-opus-4-6-thinking,google-antigravity/gemini-3-flash,deepseek/deepseek-v4-flash,zai/glm-5.1,minimax/MiniMax-M3" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts`

### Базовый уровень: вызов инструментов (Read + опциональный Exec)

Выберите как минимум одну модель на каждое семейство провайдеров:

* OpenAI: `openai/gpt-5.5`
* Anthropic: `anthropic/claude-opus-4-6` (или `anthropic/claude-sonnet-4-6`)
* Google: `google/gemini-3-flash-preview` (или `google/gemini-3.1-pro-preview`)
* DeepSeek: `deepseek/deepseek-v4-flash`
* Z.AI (GLM): `zai/glm-5.1` (общий API) или `zai/glm-5.2` (Coding Plan)
* MiniMax: `minimax/MiniMax-M3`

Опциональное дополнительное покрытие (желательно):

* xAI: `xai/grok-4.3` (или последняя доступная)
* Mistral: `mistral/`… (выберите одну поддерживающую "tools" модель, которая у вас включена)
* Cerebras: `cerebras/`… (если у вас есть доступ)
* LM Studio: `lmstudio/`… (локально; вызов инструментов зависит от режима API)

### Vision: отправка изображения (вложение → мультимодальное сообщение)

Включите как минимум одну модель с поддержкой изображений в `OPENCLAW_LIVE_GATEWAY_MODELS` (варианты Claude/Gemini/OpenAI с поддержкой vision и т. д.), чтобы выполнить проверку изображения.

### Агрегаторы / альтернативные Gateway

Если у вас включены ключи, мы также поддерживаем тестирование через:

* OpenRouter: `openrouter/...` (сотни моделей; используйте `openclaw models scan`, чтобы найти кандидатов с поддержкой инструментов+изображений)
* OpenCode: `opencode/...` для Zen и `opencode-go/...` для Go (аутентификация через `OPENCODE_API_KEY` / `OPENCODE_ZEN_API_KEY`)

Другие провайдеры, которых можно включить в live-матрицу (если у вас есть учетные данные/конфигурация):

* Встроенные: `openai`, `anthropic`, `google`, `google-vertex`, `google-antigravity`, `google-gemini-cli`, `zai`, `openrouter`, `opencode`, `opencode-go`, `xai`, `groq`, `cerebras`, `mistral`, `github-copilot`
* Через `models.providers` (пользовательские конечные точки): `minimax` (облако/API), а также любой OpenAI/Anthropic-совместимый прокси (LM Studio, vLLM, LiteLLM и т. д.)

<Tip>
  Не прописывайте жестко «все модели» в документации. Авторитетный список — это то, что `discoverModels(...)` возвращает на вашей машине, плюс все доступные ключи.
</Tip>

## Учетные данные (никогда не коммитьте)

Живые тесты обнаруживают учетные данные так же, как это делает CLI. Практические следствия:

* Если CLI работает, живые тесты должны найти те же ключи.

* Если живой тест сообщает «нет учетных данных», отлаживайте это так же, как вы отлаживали бы `openclaw models list` / выбор модели.

* Профили аутентификации для каждого агента: `~/.openclaw/agents/<agentId>/agent/auth-profiles.json` (именно это означает «ключи профиля» в живых тестах)

* Конфигурация: `~/.openclaw/openclaw.json` (или `OPENCLAW_CONFIG_PATH`)

* Устаревший каталог состояния: `~/.openclaw/credentials/` (копируется в подготовленный живой домашний каталог при наличии, но не является основным хранилищем ключей профилей)

* Локальные живые запуски по умолчанию копируют активную конфигурацию, файлы `auth-profiles.json` для каждого агента, устаревший `credentials/` и поддерживаемые внешние каталоги аутентификации CLI во временный тестовый домашний каталог; подготовленные живые домашние каталоги пропускают `workspace/` и `sandboxes/`, а переопределения путей `agents.*.workspace` / `agentDir` удаляются, чтобы проверки не попадали в ваше реальное рабочее пространство на хосте.

Если вы хотите полагаться на ключи из окружения, экспортируйте их перед локальными тестами или используйте
Docker-запускатели ниже с явным `OPENCLAW_PROFILE_FILE`.

## Deepgram live (транскрибация аудио)

* Тест: `extensions/deepgram/audio.live.test.ts`
* Включение: `DEEPGRAM_API_KEY=... DEEPGRAM_LIVE_TEST=1 pnpm test:live extensions/deepgram/audio.live.test.ts`

## Живой тест плана кодирования BytePlus

* Тест: `extensions/byteplus/live.test.ts`
* Включение: `BYTEPLUS_API_KEY=... BYTEPLUS_LIVE_TEST=1 pnpm test:live extensions/byteplus/live.test.ts`
* Необязательное переопределение модели: `BYTEPLUS_CODING_MODEL=ark-code-latest`

## Живой тест медиа для workflow ComfyUI

* Тест: `extensions/comfy/comfy.live.test.ts`
* Включение: `OPENCLAW_LIVE_TEST=1 COMFY_LIVE_TEST=1 pnpm test:live -- extensions/comfy/comfy.live.test.ts`
* Область:
  * Проверяет встроенные пути comfy для изображений, видео и `music_generate`
  * Пропускает каждую возможность, если `plugins.entries.comfy.config.<capability>` не настроен
  * Полезно после изменений отправки workflow comfy, polling, загрузок или регистрации Plugin

## Живой тест генерации изображений

* Тест: `test/image-generation.runtime.live.test.ts`
* Команда: `pnpm test:live test/image-generation.runtime.live.test.ts`
* Оснастка: `pnpm test:live:media image`
* Область:
  * Перечисляет каждый зарегистрированный provider plugin для генерации изображений
  * Использует уже экспортированные переменные окружения провайдера перед проверкой
  * По умолчанию использует live/env API-ключи раньше сохраненных профилей аутентификации, поэтому устаревшие тестовые ключи в `auth-profiles.json` не скрывают реальные учетные данные shell
  * Пропускает провайдеры без пригодной аутентификации/профиля/модели
  * Прогоняет каждый настроенный провайдер через общий runtime генерации изображений:
    * `<provider>:generate`
    * `<provider>:edit`, когда провайдер объявляет поддержку редактирования
* Текущие покрытые встроенные провайдеры:
  * `deepinfra`
  * `fal`
  * `google`
  * `minimax`
  * `openai`
  * `openrouter`
  * `vydra`
  * `xai`
* Необязательное сужение:
  * `OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS="openai,google,openrouter,xai"`
  * `OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS="deepinfra"`
  * `OPENCLAW_LIVE_IMAGE_GENERATION_MODELS="openai/gpt-image-2,google/gemini-3.1-flash-image-preview,openrouter/google/gemini-3.1-flash-image-preview,xai/grok-imagine-image"`
  * `OPENCLAW_LIVE_IMAGE_GENERATION_CASES="google:flash-generate,google:pro-edit,openrouter:generate,xai:default-generate,xai:default-edit"`
* Необязательное поведение аутентификации:
  * `OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1`, чтобы принудительно использовать аутентификацию из хранилища профилей и игнорировать переопределения только из окружения

Для поставляемого пути CLI добавьте smoke-тест `infer` после успешного прохождения живого
теста provider/runtime:

```bash theme={"theme":{"light":"min-light","dark":"min-dark"}}
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_INFER_CLI_TEST=1 pnpm test:live -- test/image-generation.infer-cli.live.test.ts
openclaw infer image providers --json
openclaw infer image generate \
  --model google/gemini-3.1-flash-image-preview \
  --prompt "Minimal flat test image: one blue square on a white background, no text." \
  --output ./openclaw-infer-image-smoke.png \
  --json
```

Это покрывает разбор аргументов CLI, разрешение конфигурации/default-agent, активацию встроенного
Plugin, общий runtime генерации изображений и живой запрос к провайдеру. Ожидается, что зависимости Plugin присутствуют до загрузки runtime.

## Живой тест генерации музыки

* Тест: `extensions/music-generation-providers.live.test.ts`
* Включение: `OPENCLAW_LIVE_TEST=1 pnpm test:live -- extensions/music-generation-providers.live.test.ts`
* Оснастка: `pnpm test:live:media music`
* Область:
  * Проверяет общий путь встроенного провайдера генерации музыки
  * В настоящее время покрывает Google и MiniMax
  * Использует уже экспортированные переменные окружения провайдера перед проверкой
  * По умолчанию использует live/env API-ключи раньше сохраненных профилей аутентификации, поэтому устаревшие тестовые ключи в `auth-profiles.json` не скрывают реальные учетные данные shell
  * Пропускает провайдеры без пригодной аутентификации/профиля/модели
  * Запускает оба объявленных режима runtime, когда они доступны:
    * `generate` с вводом только prompt
    * `edit`, когда провайдер объявляет `capabilities.edit.enabled`
  * Текущее покрытие общего lane:
    * `google`: `generate`, `edit`
    * `minimax`: `generate`
    * `comfy`: отдельный живой файл Comfy, не этот общий sweep
* Необязательное сужение:
  * `OPENCLAW_LIVE_MUSIC_GENERATION_PROVIDERS="google,minimax"`
  * `OPENCLAW_LIVE_MUSIC_GENERATION_MODELS="google/lyria-3-clip-preview,minimax/music-2.6"`
* Необязательное поведение аутентификации:
  * `OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1`, чтобы принудительно использовать аутентификацию из хранилища профилей и игнорировать переопределения только из окружения

## Живой тест генерации видео

* Тест: `extensions/video-generation-providers.live.test.ts`
* Включение: `OPENCLAW_LIVE_TEST=1 pnpm test:live -- extensions/video-generation-providers.live.test.ts`
* Оснастка: `pnpm test:live:media video`
* Область:
  * Проверяет общий путь встроенного провайдера генерации видео
  * По умолчанию использует release-safe smoke-путь: провайдеры не FAL, один text-to-video запрос на провайдера, prompt с омаром на одну секунду и лимит операции на провайдера из `OPENCLAW_LIVE_VIDEO_GENERATION_TIMEOUT_MS` (`180000` по умолчанию)
  * По умолчанию пропускает FAL, потому что задержка очереди на стороне провайдера может доминировать во времени релиза; передайте `--video-providers fal` или `OPENCLAW_LIVE_VIDEO_GENERATION_PROVIDERS="fal"`, чтобы запустить его явно
  * Использует уже экспортированные переменные окружения провайдера перед проверкой
  * По умолчанию использует live/env API-ключи раньше сохраненных профилей аутентификации, поэтому устаревшие тестовые ключи в `auth-profiles.json` не скрывают реальные учетные данные shell
  * Пропускает провайдеры без пригодной аутентификации/профиля/модели
  * По умолчанию запускает только `generate`
  * Установите `OPENCLAW_LIVE_VIDEO_GENERATION_FULL_MODES=1`, чтобы также запускать объявленные режимы transform, когда они доступны:
    * `imageToVideo`, когда провайдер объявляет `capabilities.imageToVideo.enabled`, а выбранный провайдер/модель принимает локальный ввод изображения на основе буфера в общем sweep
    * `videoToVideo`, когда провайдер объявляет `capabilities.videoToVideo.enabled`, а выбранный провайдер/модель принимает локальный ввод видео на основе буфера в общем sweep
  * Текущие объявленные, но пропускаемые провайдеры `imageToVideo` в общем sweep:
    * `vydra`, потому что встроенный `veo3` поддерживает только текст, а встроенный `kling` требует удаленный URL изображения
  * Покрытие Vydra для конкретного провайдера:
    * `OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_VYDRA_VIDEO=1 pnpm test:live -- extensions/vydra/vydra.live.test.ts`
    * этот файл запускает `veo3` text-to-video плюс lane `kling`, который по умолчанию использует фикстуру с удаленным URL изображения
  * Текущее живое покрытие `videoToVideo`:
    * только `runway`, когда выбранная модель — `runway/gen4_aleph`
  * Текущие объявленные, но пропускаемые провайдеры `videoToVideo` в общем sweep:
    * `alibaba`, `qwen`, `xai`, потому что эти пути сейчас требуют удаленные эталонные URL `http(s)` / MP4
    * `google`, потому что текущий общий lane Gemini/Veo использует локальный ввод на основе буфера, а этот путь не принимается в общем sweep
    * `openai`, потому что текущему общему lane не хватает гарантий доступа к редактированию видео, зависящих от организации
* Необязательное сужение:
  * `OPENCLAW_LIVE_VIDEO_GENERATION_PROVIDERS="deepinfra,google,openai,runway"`
  * `OPENCLAW_LIVE_VIDEO_GENERATION_MODELS="google/veo-3.1-fast-generate-preview,openai/sora-2,runway/gen4_aleph"`
  * `OPENCLAW_LIVE_VIDEO_GENERATION_SKIP_PROVIDERS=""`, чтобы включить каждого провайдера в sweep по умолчанию, включая FAL
  * `OPENCLAW_LIVE_VIDEO_GENERATION_TIMEOUT_MS=60000`, чтобы уменьшить лимит каждой операции провайдера для агрессивного smoke-запуска
* Необязательное поведение аутентификации:
  * `OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1`, чтобы принудительно использовать аутентификацию из хранилища профилей и игнорировать переопределения только из окружения

## Живая media-оснастка

* Команда: `pnpm test:live:media`
* Назначение:
  * Запускает общие живые наборы тестов изображений, музыки и видео через одну repo-native точку входа
  * Использует уже экспортированные переменные окружения провайдера
  * По умолчанию автоматически сужает каждый набор до провайдеров, для которых сейчас есть пригодная аутентификация
  * Повторно использует `scripts/test-live.mjs`, поэтому поведение Heartbeat и quiet-mode остается согласованным
* Примеры:
  * `pnpm test:live:media`
  * `pnpm test:live:media image video --providers openai,google,minimax`
  * `pnpm test:live:media video --video-providers openai,runway --all-providers`
  * `pnpm test:live:media music --quiet`

## Связанные материалы

* [Тестирование](/ru/help/testing) - unit, integration, QA и Docker-наборы