Für den Schnellstart, QA-Runner, Unit-/Integrationssuiten und Docker-Abläufe siehe Testing. Diese Seite behandelt die Live-Testsuiten (mit Netzwerkzugriff): Modellmatrix, CLI-Backends, ACP und Live-Tests für Medien-Provider sowie den Umgang mit Anmeldeinformationen.Documentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
Live: Smoke-Befehle für lokale Profile
Laden Sie~/.profile vor Ad-hoc-Live-Prüfungen, damit Provider-Schlüssel und lokale Tool-
Pfade Ihrer Shell entsprechen:
voicecall smoke ist ein Trockenlauf, sofern nicht auch --yes vorhanden ist. Verwenden Sie --yes nur,
wenn Sie absichtlich einen echten Benachrichtigungsanruf auslösen möchten. Für Twilio, Telnyx und
Plivo erfordert eine erfolgreiche Bereitschaftsprüfung eine öffentliche Webhook-URL; rein lokale
loopback-/private Fallbacks werden absichtlich abgelehnt.
Live: Android-Node-Capability-Sweep
- Test:
src/gateway/android-node.capabilities.live.test.ts - Skript:
pnpm android:test:integration - Ziel: jeden aktuell angekündigten Befehl eines verbundenen Android-Node aufrufen und das Verhalten des Befehlsvertrags prüfen.
- Umfang:
- Vorausgesetzte/manuelle Einrichtung (die Suite installiert/startet/paart die App nicht).
- Befehlsweise Gateway-
node.invoke-Validierung für den ausgewählten Android-Node.
- Erforderliche Voreinrichtung:
- Android-App bereits verbunden und mit dem Gateway gepaart.
- App im Vordergrund halten.
- Berechtigungen/Erfassungseinwilligung für Capabilities erteilt, die Sie erfolgreich prüfen möchten.
- Optionale Ziel-Overrides:
OPENCLAW_ANDROID_NODE_IDoderOPENCLAW_ANDROID_NODE_NAME.OPENCLAW_ANDROID_GATEWAY_URL/OPENCLAW_ANDROID_GATEWAY_TOKEN/OPENCLAW_ANDROID_GATEWAY_PASSWORD.
- Vollständige Details zur Android-Einrichtung: Android App
Live: Modell-Smoke (Profilschlüssel)
Live-Tests sind in zwei Ebenen aufgeteilt, damit wir Fehler isolieren können:- „Direktes Modell“ zeigt, ob der Provider/das Modell mit dem angegebenen Schlüssel überhaupt antworten kann.
- „Gateway-Smoke“ zeigt, ob die vollständige Gateway+Agent-Pipeline für dieses Modell funktioniert (Sitzungen, Verlauf, Tools, Sandbox-Richtlinie usw.).
Ebene 1: Direkter Modellabschluss (kein Gateway)
- Test:
src/agents/models.profiles.live.test.ts - Ziel:
- Erkannte Modelle auflisten
getApiKeyForModelverwenden, um Modelle auszuwählen, für die Sie Anmeldeinformationen haben- Pro Modell einen kleinen Abschluss ausführen (und gezielte Regressionen, wo nötig)
- Aktivierung:
pnpm test:live(oderOPENCLAW_LIVE_TEST=1, wenn Vitest direkt aufgerufen wird)
- Setzen Sie
OPENCLAW_LIVE_MODELS=modern(oderall, Alias für modern), um diese Suite tatsächlich auszuführen; andernfalls wird sie übersprungen, damitpnpm test:liveauf Gateway-Smoke fokussiert bleibt - Modellauswahl:
OPENCLAW_LIVE_MODELS=modern, um die moderne Allowlist auszuführen (Opus/Sonnet 4.6+, GPT-5.2 + Codex, Gemini 3, DeepSeek V4, GLM 4.7, MiniMax M2.7, Grok 4.3)OPENCLAW_LIVE_MODELS=allist ein Alias für die moderne Allowlist- oder
OPENCLAW_LIVE_MODELS="openai/gpt-5.5,openai-codex/gpt-5.5,anthropic/claude-opus-4-6,..."(kommagetrennte Allowlist) - Modern/all-Sweeps verwenden standardmäßig eine kuratierte High-Signal-Obergrenze; setzen Sie
OPENCLAW_LIVE_MAX_MODELS=0für einen vollständigen Modern-Sweep oder eine positive Zahl für eine kleinere Obergrenze. - Vollständige Sweeps verwenden
OPENCLAW_LIVE_TEST_TIMEOUT_MSfür das gesamte direkte Modelltest-Timeout. Standard: 60 Minuten. - Direkte Modellprüfungen laufen standardmäßig mit 20-facher Parallelität; setzen Sie
OPENCLAW_LIVE_MODEL_CONCURRENCY, um dies zu überschreiben.
- Provider-Auswahl:
OPENCLAW_LIVE_PROVIDERS="google,google-antigravity,google-gemini-cli"(kommagetrennte Allowlist)
- Herkunft der Schlüssel:
- Standardmäßig: Profilspeicher und Env-Fallbacks
- Setzen Sie
OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1, um ausschließlich den Profilspeicher zu erzwingen
- Zweck:
- Trennt „Provider-API ist defekt / Schlüssel ist ungültig“ von „Gateway-Agent-Pipeline ist defekt“
- Enthält kleine, isolierte Regressionen (Beispiel: OpenAI Responses/Codex Responses Reasoning-Replay + Tool-Call-Flows)
Ebene 2: Gateway + Dev-Agent-Smoke (was „@openclaw“ tatsächlich tut)
- Test:
src/gateway/gateway-models.profiles.live.test.ts - Ziel:
- Ein In-Process-Gateway starten
- Eine
agent:dev:*-Sitzung erstellen/patchen (Modell-Override pro Lauf) - Modelle mit Schlüsseln durchlaufen und prüfen:
- „aussagekräftige“ Antwort (keine Tools)
- ein echter Tool-Aufruf funktioniert (Leseprüfung)
- optionale zusätzliche Tool-Prüfungen (Exec+Leseprüfung)
- OpenAI-Regressionspfade (nur Tool-Call → Folgeanfrage) funktionieren weiter
- Prüfungsdetails (damit Sie Fehler schnell erklären können):
read-Prüfung: Der Test schreibt eine Nonce-Datei in den Workspace und fordert den Agent auf, sie mitreadzu lesen und die Nonce zurückzugeben.exec+read-Prüfung: Der Test fordert den Agent auf, perexeceine Nonce in eine temporäre Datei zu schreiben und sie dann perreadzurückzulesen.- Bildprüfung: Der Test hängt ein generiertes PNG an (Katze + randomisierter Code) und erwartet, dass das Modell
cat <CODE>zurückgibt. - Implementierungsreferenz:
src/gateway/gateway-models.profiles.live.test.tsundsrc/gateway/live-image-probe.ts.
- Aktivierung:
pnpm test:live(oderOPENCLAW_LIVE_TEST=1, wenn Vitest direkt aufgerufen wird)
- Modellauswahl:
- Standard: moderne Allowlist (Opus/Sonnet 4.6+, GPT-5.2 + Codex, Gemini 3, DeepSeek V4, GLM 4.7, MiniMax M2.7, Grok 4.3)
OPENCLAW_LIVE_GATEWAY_MODELS=allist ein Alias für die moderne Allowlist- Oder setzen Sie
OPENCLAW_LIVE_GATEWAY_MODELS="provider/model"(oder eine kommagetrennte Liste), um einzugrenzen - Modern/all-Gateway-Sweeps verwenden standardmäßig eine kuratierte High-Signal-Obergrenze; setzen Sie
OPENCLAW_LIVE_GATEWAY_MAX_MODELS=0für einen vollständigen Modern-Sweep oder eine positive Zahl für eine kleinere Obergrenze.
- Provider-Auswahl („OpenRouter für alles“ vermeiden):
OPENCLAW_LIVE_GATEWAY_PROVIDERS="google,google-antigravity,google-gemini-cli,openai,anthropic,zai,minimax"(kommagetrennte Allowlist)
- Tool- und Bildprüfungen sind in diesem Live-Test immer aktiv:
read-Prüfung +exec+read-Prüfung (Tool-Stresstest)- Bildprüfung läuft, wenn das Modell Unterstützung für Bildeingaben ankündigt
- Ablauf (auf hoher Ebene):
- Test generiert ein kleines PNG mit „CAT“ + Zufallscode (
src/gateway/live-image-probe.ts) - Sendet es über
agentattachments: [{ mimeType: "image/png", content: "<base64>" }] - Gateway parst Anhänge in
images[](src/gateway/server-methods/agent.ts+src/gateway/chat-attachments.ts) - Eingebetteter Agent leitet eine multimodale Benutzernachricht an das Modell weiter
- Assertion: Antwort enthält
cat+ den Code (OCR-Toleranz: kleinere Fehler erlaubt)
- Test generiert ein kleines PNG mit „CAT“ + Zufallscode (
Live: CLI-Backend-Smoke (Claude, Codex, Gemini oder andere lokale CLIs)
- Test:
src/gateway/gateway-cli-backend.live.test.ts - Ziel: die Gateway- + Agent-Pipeline mit einem lokalen CLI-Backend validieren, ohne Ihre Standardkonfiguration zu berühren.
- Backend-spezifische Smoke-Standards befinden sich in der
cli-backend.ts-Definition des zuständigen Plugins. - Aktivieren:
pnpm test:live(oderOPENCLAW_LIVE_TEST=1, wenn Vitest direkt aufgerufen wird)OPENCLAW_LIVE_CLI_BACKEND=1
- Standards:
- Standard-Provider/-Modell:
claude-cli/claude-sonnet-4-6 - Befehls-/Argument-/Bildverhalten stammt aus den Metadaten des zuständigen CLI-Backend-Plugins.
- Standard-Provider/-Modell:
- Overrides (optional):
OPENCLAW_LIVE_CLI_BACKEND_MODEL="codex-cli/gpt-5.5"OPENCLAW_LIVE_CLI_BACKEND_COMMAND="/full/path/to/codex"OPENCLAW_LIVE_CLI_BACKEND_ARGS='["exec","--json","--color","never","--sandbox","read-only","--skip-git-repo-check"]'OPENCLAW_LIVE_CLI_BACKEND_IMAGE_PROBE=1, um einen echten Bildanhang zu senden (Pfade werden in den Prompt injiziert). Docker-Rezepte deaktivieren dies standardmäßig, sofern nicht ausdrücklich angefordert.OPENCLAW_LIVE_CLI_BACKEND_IMAGE_ARG="--image", um Bilddateipfade als CLI-Argumente statt per Prompt-Injektion zu übergeben.OPENCLAW_LIVE_CLI_BACKEND_IMAGE_MODE="repeat"(oder"list"), um zu steuern, wie Bildargumente übergeben werden, wennIMAGE_ARGgesetzt ist.OPENCLAW_LIVE_CLI_BACKEND_RESUME_PROBE=1, um eine zweite Runde zu senden und den Fortsetzungsfluss zu validieren.OPENCLAW_LIVE_CLI_BACKEND_MODEL_SWITCH_PROBE=1, um sich für die Claude-Sonnet-zu-Opus-Kontinuitätsprüfung in derselben Sitzung zu entscheiden, wenn das ausgewählte Modell ein Wechselziel unterstützt. Docker-Rezepte deaktivieren dies standardmäßig zugunsten aggregierter Zuverlässigkeit.OPENCLAW_LIVE_CLI_BACKEND_MCP_PROBE=1, um sich für die MCP-/Tool-loopback-Prüfung zu entscheiden. Docker-Rezepte deaktivieren dies standardmäßig, sofern nicht ausdrücklich angefordert.
gemini --debug mcp list aus, um nachzuweisen, dass ein
gespeicherter transport: "streamable-http"-Server in Geminis HTTP-MCP-
Form normalisiert wird und eine Verbindung zu einem lokalen streamable-HTTP-MCP-Server herstellen kann.
Docker-Rezept:
- Der Docker-Runner befindet sich unter
scripts/test-live-cli-backend-docker.sh. - Er führt den Live-CLI-Backend-Smoke innerhalb des Repo-Docker-Images als Nicht-Root-Benutzer
nodeaus. - Er löst CLI-Smoke-Metadaten aus dem zuständigen Plugin auf und installiert dann das passende Linux-CLI-Paket (
@anthropic-ai/claude-code,@openai/codexoder@google/gemini-cli) in ein zwischengespeichertes beschreibbares Präfix unterOPENCLAW_DOCKER_CLI_TOOLS_DIR(Standard:~/.cache/openclaw/docker-cli-tools). pnpm test:docker:live-cli-backend:claude-subscriptionerfordert portable Claude-Code-Subscription-OAuth entweder über~/.claude/.credentials.jsonmitclaudeAiOauth.subscriptionTypeoderCLAUDE_CODE_OAUTH_TOKENausclaude setup-token. Es weist zuerst direktesclaude -pin Docker nach und führt dann zwei Gateway-CLI-Backend-Runden ohne Beibehaltung von Anthropic-API-Schlüssel-Env-Vars aus. Diese Subscription-Lane deaktiviert standardmäßig die Claude-MCP-/Tool- und Bildprüfungen, weil Claude die Nutzung durch Drittanbieter-Apps derzeit über Zusatznutzungsabrechnung statt über normale Subscription-Planlimits routet.- Der Live-CLI-Backend-Smoke übt jetzt denselben End-to-End-Ablauf für Claude, Codex und Gemini aus: Textrunde, Bildklassifizierungsrunde, dann MCP-
cron-Tool-Aufruf, der über die Gateway-CLI verifiziert wird. - Claudes Standard-Smoke patcht außerdem die Sitzung von Sonnet auf Opus und verifiziert, dass sich die fortgesetzte Sitzung weiterhin an eine frühere Notiz erinnert.
Live: APNs-HTTP/2-Proxy-Erreichbarkeit
- Test:
src/infra/push-apns-http2.live.test.ts - Ziel: über einen lokalen HTTP-CONNECT-Proxy zu Apples Sandbox-APNs-Endpunkt tunneln, die APNs-HTTP/2-Validierungsanfrage senden und prüfen, dass Apples echte
403 InvalidProviderToken-Antwort über den Proxy-Pfad zurückkommt. - Aktivieren:
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_APNS_REACHABILITY=1 pnpm test:live src/infra/push-apns-http2.live.test.ts
- Optionales Timeout:
OPENCLAW_LIVE_APNS_TIMEOUT_MS=30000
Live: ACP-Bind-Smoke (/acp spawn ... --bind here)
- Test:
src/gateway/gateway-acp-bind.live.test.ts - Ziel: den echten ACP-Gesprächsbindungsablauf mit einem Live-ACP-Agenten validieren:
/acp spawn <agent> --bind heresenden- ein synthetisches Message-Channel-Gespräch vor Ort binden
- eine normale Folgeantwort im selben Gespräch senden
- prüfen, dass die Folgeantwort im Transcript der gebundenen ACP-Sitzung ankommt
- Aktivieren:
pnpm test:live src/gateway/gateway-acp-bind.live.test.tsOPENCLAW_LIVE_ACP_BIND=1
- Standardwerte:
- ACP-Agenten in Docker:
claude,codex,gemini - ACP-Agent für direktes
pnpm test:live ...:claude - Synthetischer Channel: Slack-DM-artiger Gesprächskontext
- ACP-Backend:
acpx
- ACP-Agenten in Docker:
- Überschreibungen:
OPENCLAW_LIVE_ACP_BIND_AGENT=claudeOPENCLAW_LIVE_ACP_BIND_AGENT=codexOPENCLAW_LIVE_ACP_BIND_AGENT=droidOPENCLAW_LIVE_ACP_BIND_AGENT=geminiOPENCLAW_LIVE_ACP_BIND_AGENT=opencodeOPENCLAW_LIVE_ACP_BIND_AGENTS=claude,codex,geminiOPENCLAW_LIVE_ACP_BIND_AGENT_COMMAND='npx -y @agentclientprotocol/claude-agent-acp@<version>'OPENCLAW_LIVE_ACP_BIND_CODEX_MODEL=gpt-5.5OPENCLAW_LIVE_ACP_BIND_OPENCODE_MODEL=opencode/kimi-k2.6OPENCLAW_LIVE_ACP_BIND_REQUIRE_TRANSCRIPT=1OPENCLAW_LIVE_ACP_BIND_REQUIRE_CRON=1OPENCLAW_LIVE_ACP_BIND_PARENT_MODEL=openai/gpt-5.5
- Hinweise:
- Dieser Lane nutzt die Gateway-
chat.send-Oberfläche mit nur für Admins gedachten synthetischen Ursprung-Routen-Feldern, damit Tests Message-Channel-Kontext anhängen können, ohne so zu tun, als würden sie extern zustellen. - Wenn
OPENCLAW_LIVE_ACP_BIND_AGENT_COMMANDnicht gesetzt ist, verwendet der Test die integrierte Agentenregistrierung des eingebettetenacpx-Plugins für den ausgewählten ACP-Harness-Agenten. - Die Cron-MCP-Erstellung für gebundene Sitzungen erfolgt standardmäßig nach bestem Ermessen, weil externe ACP-Harnesses MCP-Aufrufe nach bestandener Bind-/Image-Prüfung abbrechen können; setzen Sie
OPENCLAW_LIVE_ACP_BIND_REQUIRE_CRON=1, um diese Cron-Prüfung nach dem Binden strikt zu machen.
- Dieser Lane nutzt die Gateway-
- Der Docker-Runner befindet sich unter
scripts/test-live-acp-bind-docker.sh. - Standardmäßig führt er den ACP-Bind-Smoke nacheinander gegen die aggregierten Live-CLI-Agenten aus:
claude,codex, danngemini. - Verwenden Sie
OPENCLAW_LIVE_ACP_BIND_AGENTS=claude,OPENCLAW_LIVE_ACP_BIND_AGENTS=codex,OPENCLAW_LIVE_ACP_BIND_AGENTS=droid,OPENCLAW_LIVE_ACP_BIND_AGENTS=geminioderOPENCLAW_LIVE_ACP_BIND_AGENTS=opencode, um die Matrix einzugrenzen. - Er lädt
~/.profile, legt das passende CLI-Authentifizierungsmaterial im Container bereit und installiert dann bei Bedarf die angeforderte Live-CLI (@anthropic-ai/claude-code,@openai/codex, Factory Droid überhttps://app.factory.ai/cli,@google/gemini-clioderopencode-ai). Das ACP-Backend selbst ist das eingebettete Paketacpx/runtimeaus dem offiziellenacpx-Plugin. - Die Droid-Docker-Variante stellt
~/.factoryfür Einstellungen bereit, leitetFACTORY_API_KEYweiter und benötigt diesen API-Schlüssel, weil lokale Factory-OAuth-/Keyring-Authentifizierung nicht portabel in den Container ist. Sie verwendet den integrierten Registrierungseintragdroid exec --output-format acpvon ACPX. - Die OpenCode-Docker-Variante ist eine strikte Regressions-Lane für einen einzelnen Agenten. Sie schreibt nach dem Laden von
~/.profileein temporäresOPENCODE_CONFIG_CONTENT-Standardmodell ausOPENCLAW_LIVE_ACP_BIND_OPENCODE_MODEL(Standardopencode/kimi-k2.6), undpnpm test:docker:live-acp-bind:opencodeverlangt ein gebundenes Assistant-Transcript, statt den generischen Skip nach dem Binden zu akzeptieren. - Direkte
acpx-CLI-Aufrufe sind nur ein manueller/Workaround-Pfad zum Vergleichen des Verhaltens außerhalb des Gateway. Der Docker-ACP-Bind-Smoke testet das eingebetteteacpx-Runtime-Backend von OpenClaw.
Live: Codex-App-Server-Harness-Smoke
- Ziel: das Plugin-eigene Codex-Harness über die normale Gateway-
agent-Methode validieren:- das gebündelte
codex-Plugin laden openai/gpt-5.5auswählen, wodurch OpenAI-Agent-Turns standardmäßig über Codex geleitet werden- einen ersten Gateway-Agent-Turn an
openai/gpt-5.5mit ausgewähltem Codex-Harness senden - einen zweiten Turn an dieselbe OpenClaw-Sitzung senden und prüfen, dass der App-Server- Thread fortgesetzt werden kann
/codex statusund/codex modelsüber denselben Gateway-Befehlspfad ausführen- optional zwei von Guardian geprüfte eskalierte Shell-Probes ausführen: einen harmlosen Befehl, der genehmigt werden sollte, und einen Fake-Secret-Upload, der abgelehnt werden sollte, sodass der Agent zurückfragt
- das gebündelte
- Test:
src/gateway/gateway-codex-harness.live.test.ts - Aktivieren:
OPENCLAW_LIVE_CODEX_HARNESS=1 - Standardmodell:
openai/gpt-5.5 - Optionale Image-Probe:
OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=1 - Optionale MCP-/Tool-Probe:
OPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=1 - Optionale Guardian-Probe:
OPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=1 - Der Smoke erzwingt Provider/Modell
agentRuntime.id: "codex", damit ein defektes Codex- Harness nicht durch stilles Zurückfallen auf PI bestehen kann. - Authentifizierung: Codex-App-Server-Authentifizierung aus der lokalen Codex-Abonnementanmeldung. Docker-
Smokes können bei Bedarf außerdem
OPENAI_API_KEYfür Nicht-Codex-Probes bereitstellen, plus optional kopierte~/.codex/auth.jsonund~/.codex/config.toml.
- Der Docker-Runner befindet sich unter
scripts/test-live-codex-harness-docker.sh. - Er lädt das gemountete
~/.profile, übergibtOPENAI_API_KEY, kopiert Codex-CLI- Authentifizierungsdateien, wenn vorhanden, installiert@openai/codexin ein beschreibbares gemountetes npm- Präfix, stellt den Quellbaum bereit und führt dann nur den Codex-Harness-Live-Test aus. - Docker aktiviert die Image-, MCP-/Tool- und Guardian-Probes standardmäßig. Setzen Sie
OPENCLAW_LIVE_CODEX_HARNESS_IMAGE_PROBE=0oderOPENCLAW_LIVE_CODEX_HARNESS_MCP_PROBE=0oderOPENCLAW_LIVE_CODEX_HARNESS_GUARDIAN_PROBE=0, wenn Sie einen engeren Debug- Lauf benötigen. - Docker verwendet dieselbe explizite Codex-Runtime-Konfiguration, sodass Legacy-Aliase oder PI- Fallback eine Codex-Harness-Regression nicht verbergen können.
Empfohlene Live-Rezepte
Enge, explizite Allowlists sind am schnellsten und am wenigsten fehleranfällig:-
Einzelnes Modell, direkt (kein Gateway):
OPENCLAW_LIVE_MODELS="openai/gpt-5.5" pnpm test:live src/agents/models.profiles.live.test.ts
-
Einzelnes Modell, Gateway-Smoke:
OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
-
Tool-Aufrufe über mehrere Provider hinweg:
OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5,openai-codex/gpt-5.5,anthropic/claude-opus-4-6,google/gemini-3-flash-preview,deepseek/deepseek-v4-flash,zai/glm-5.1,minimax/MiniMax-M2.7" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
-
Google-Fokus (Gemini-API-Schlüssel + Antigravity):
- Gemini (API-Schlüssel):
OPENCLAW_LIVE_GATEWAY_MODELS="google/gemini-3-flash-preview" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts - Antigravity (OAuth):
OPENCLAW_LIVE_GATEWAY_MODELS="google-antigravity/claude-opus-4-6-thinking,google-antigravity/gemini-3-pro-high" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
- Gemini (API-Schlüssel):
-
Google-Smoke für adaptives Denken:
- Wenn lokale Schlüssel im Shell-Profil liegen:
source ~/.profile - Dynamischer Gemini-3-Standardwert:
pnpm openclaw qa manual --provider-mode live-frontier --model google/gemini-3.1-pro-preview --alt-model google/gemini-3.1-pro-preview --message '/think adaptive Reply exactly: GEMINI_ADAPTIVE_OK' --timeout-ms 180000 - Dynamisches Gemini-2.5-Budget:
pnpm openclaw qa manual --provider-mode live-frontier --model google/gemini-2.5-flash --alt-model google/gemini-2.5-flash --message '/think adaptive Reply exactly: GEMINI25_ADAPTIVE_OK' --timeout-ms 180000
- Wenn lokale Schlüssel im Shell-Profil liegen:
google/...verwendet die Gemini-API (API-Schlüssel).google-antigravity/...verwendet die Antigravity-OAuth-Bridge (Cloud-Code-Assist-artiger Agent-Endpunkt).google-gemini-cli/...verwendet die lokale Gemini-CLI auf Ihrem Rechner (separate Authentifizierung + Eigenheiten beim Tooling).- Gemini-API vs. Gemini-CLI:
- API: OpenClaw ruft Googles gehostete Gemini-API per HTTP auf (API-Schlüssel / Profil-Authentifizierung); das meinen die meisten Benutzer mit “Gemini”.
- CLI: OpenClaw startet ein lokales
gemini-Binary per Shell; es hat seine eigene Authentifizierung und kann sich anders verhalten (Streaming-/Tool-Unterstützung/Versionsabweichung).
Live: Modellmatrix (was wir abdecken)
Es gibt keine feste “CI-Modellliste” (Live ist Opt-in), aber dies sind die empfohlenen Modelle, die regelmäßig auf einem Entwicklungsrechner mit Schlüsseln abgedeckt werden sollten.Modernes Smoke-Set (Tool-Aufrufe + Image)
Dies ist der Lauf für “gängige Modelle”, von dem wir erwarten, dass er funktionsfähig bleibt:- OpenAI (nicht Codex):
openai/gpt-5.5 - OpenAI Codex OAuth:
openai-codex/gpt-5.5 - Anthropic:
anthropic/claude-opus-4-6(oderanthropic/claude-sonnet-4-6) - Google (Gemini-API):
google/gemini-3.1-pro-previewundgoogle/gemini-3-flash-preview(ältere Gemini-2.x-Modelle vermeiden) - Google (Antigravity):
google-antigravity/claude-opus-4-6-thinkingundgoogle-antigravity/gemini-3-flash - DeepSeek:
deepseek/deepseek-v4-flashunddeepseek/deepseek-v4-pro - Z.AI (GLM):
zai/glm-5.1 - MiniMax:
minimax/MiniMax-M2.7
OPENCLAW_LIVE_GATEWAY_MODELS="openai/gpt-5.5,openai-codex/gpt-5.5,anthropic/claude-opus-4-6,google/gemini-3.1-pro-preview,google/gemini-3-flash-preview,google-antigravity/claude-opus-4-6-thinking,google-antigravity/gemini-3-flash,deepseek/deepseek-v4-flash,zai/glm-5.1,minimax/MiniMax-M2.7" pnpm test:live src/gateway/gateway-models.profiles.live.test.ts
Baseline: Tool-Aufrufe (Read + optional Exec)
Wählen Sie mindestens eines pro Provider-Familie:- OpenAI:
openai/gpt-5.5 - Anthropic:
anthropic/claude-opus-4-6(oderanthropic/claude-sonnet-4-6) - Google:
google/gemini-3-flash-preview(odergoogle/gemini-3.1-pro-preview) - DeepSeek:
deepseek/deepseek-v4-flash - Z.AI (GLM):
zai/glm-5.1 - MiniMax:
minimax/MiniMax-M2.7
- xAI:
xai/grok-4.3(oder neuestes verfügbares) - Mistral:
mistral/… (wählen Sie ein für “Tools” geeignetes Modell, das Sie aktiviert haben) - Cerebras:
cerebras/… (wenn Sie Zugriff haben) - LM Studio:
lmstudio/… (lokal; Tool-Aufrufe hängen vom API-Modus ab)
Vision: Image senden (Anhang → multimodale Nachricht)
Nehmen Sie mindestens ein Image-fähiges Modell inOPENCLAW_LIVE_GATEWAY_MODELS auf (Claude-/Gemini-/OpenAI-Varianten mit Vision-Fähigkeit usw.), um die Image-Probe auszuführen.
Aggregatoren / alternative Gateways
Wenn Sie Schlüssel aktiviert haben, unterstützen wir auch Tests über:- OpenRouter:
openrouter/...(Hunderte von Modellen; verwenden Sieopenclaw models scan, um Tool- und Image-fähige Kandidaten zu finden) - OpenCode:
opencode/...für Zen undopencode-go/...für Go (Authentifizierung überOPENCODE_API_KEY/OPENCODE_ZEN_API_KEY)
- Integriert:
openai,openai-codex,anthropic,google,google-vertex,google-antigravity,google-gemini-cli,zai,openrouter,opencode,opencode-go,xai,groq,cerebras,mistral,github-copilot - Über
models.providers(benutzerdefinierte Endpunkte):minimax(Cloud/API), plus beliebige OpenAI-/Anthropic-kompatible Proxys (LM Studio, vLLM, LiteLLM usw.)
Anmeldedaten (niemals committen)
Live-Tests finden Anmeldedaten auf dieselbe Weise wie die CLI. Praktische Auswirkungen:- Wenn die CLI funktioniert, sollten Live-Tests dieselben Schlüssel finden.
-
Wenn ein Live-Test „no creds“ meldet, debuggen Sie es genauso, wie Sie
openclaw models list/ die Modellauswahl debuggen würden. -
Auth-Profile pro Agent:
~/.openclaw/agents/<agentId>/agent/auth-profiles.json(das ist in den Live-Tests mit „profile keys“ gemeint) -
Konfiguration:
~/.openclaw/openclaw.json(oderOPENCLAW_CONFIG_PATH) -
Legacy-State-Verzeichnis:
~/.openclaw/credentials/(wird, falls vorhanden, in das gestagte Live-Home kopiert, ist aber nicht der Hauptspeicher für Profil-Schlüssel) -
Lokale Live-Läufe kopieren standardmäßig die aktive Konfiguration,
auth-profiles.json-Dateien pro Agent, Legacy-credentials/und unterstützte externe CLI-Auth-Verzeichnisse in ein temporäres Test-Home; gestagte Live-Homes überspringenworkspace/undsandboxes/, und Pfad-Overrides füragents.*.workspace/agentDirwerden entfernt, damit Probes nicht auf Ihrem echten Host-Workspace laufen.
~/.profile exportiert), führen Sie lokale Tests nach source ~/.profile aus, oder verwenden Sie die Docker-Runner unten (sie können ~/.profile in den Container einhängen).
Deepgram live (Audiotranskription)
- Test:
extensions/deepgram/audio.live.test.ts - Aktivieren:
DEEPGRAM_API_KEY=... DEEPGRAM_LIVE_TEST=1 pnpm test:live extensions/deepgram/audio.live.test.ts
BytePlus-Coding-Plan live
- Test:
extensions/byteplus/live.test.ts - Aktivieren:
BYTEPLUS_API_KEY=... BYTEPLUS_LIVE_TEST=1 pnpm test:live extensions/byteplus/live.test.ts - Optionaler Modell-Override:
BYTEPLUS_CODING_MODEL=ark-code-latest
ComfyUI-Workflow-Medien live
- Test:
extensions/comfy/comfy.live.test.ts - Aktivieren:
OPENCLAW_LIVE_TEST=1 COMFY_LIVE_TEST=1 pnpm test:live -- extensions/comfy/comfy.live.test.ts - Umfang:
- Testet die gebündelten comfy-Pfade für Bild, Video und
music_generate - Überspringt jede Capability, sofern
plugins.entries.comfy.config.<capability>nicht konfiguriert ist - Nützlich nach Änderungen an comfy-Workflow-Übermittlung, Polling, Downloads oder Plugin-Registrierung
- Testet die gebündelten comfy-Pfade für Bild, Video und
Bildgenerierung live
- Test:
test/image-generation.runtime.live.test.ts - Befehl:
pnpm test:live test/image-generation.runtime.live.test.ts - Harness:
pnpm test:live:media image - Umfang:
- Listet jedes registrierte Provider-Plugin für Bildgenerierung auf
- Lädt fehlende Provider-Env-Vars vor dem Probing aus Ihrer Login-Shell (
~/.profile) - Verwendet standardmäßig Live-/Env-API-Schlüssel vor gespeicherten Auth-Profilen, damit veraltete Testschlüssel in
auth-profiles.jsonkeine echten Shell-Zugangsdaten verdecken - Überspringt Provider ohne nutzbare Auth/Profile/Modell
- Führt jeden konfigurierten Provider durch die gemeinsame Bildgenerierungs-Runtime:
<provider>:generate<provider>:edit, wenn der Provider Bearbeitungsunterstützung deklariert
- Aktuell abgedeckte gebündelte Provider:
deepinfrafalgoogleminimaxopenaiopenroutervydraxai
- Optionale Eingrenzung:
OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS="openai,google,openrouter,xai"OPENCLAW_LIVE_IMAGE_GENERATION_PROVIDERS="deepinfra"OPENCLAW_LIVE_IMAGE_GENERATION_MODELS="openai/gpt-image-2,google/gemini-3.1-flash-image-preview,openrouter/google/gemini-3.1-flash-image-preview,xai/grok-imagine-image"OPENCLAW_LIVE_IMAGE_GENERATION_CASES="google:flash-generate,google:pro-edit,openrouter:generate,xai:default-generate,xai:default-edit"
- Optionales Auth-Verhalten:
OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1, um Auth aus dem Profile-Store zu erzwingen und reine Env-Overrides zu ignorieren
infer-Smoke-Test hinzu:
Musikgenerierung live
- Test:
extensions/music-generation-providers.live.test.ts - Aktivieren:
OPENCLAW_LIVE_TEST=1 pnpm test:live -- extensions/music-generation-providers.live.test.ts - Harness:
pnpm test:live:media music - Umfang:
- Testet den gemeinsamen Pfad für gebündelte Provider zur Musikgenerierung
- Deckt derzeit Google und MiniMax ab
- Lädt Provider-Env-Vars vor dem Probing aus Ihrer Login-Shell (
~/.profile) - Verwendet standardmäßig Live-/Env-API-Schlüssel vor gespeicherten Auth-Profilen, damit veraltete Testschlüssel in
auth-profiles.jsonkeine echten Shell-Zugangsdaten verdecken - Überspringt Provider ohne nutzbare Auth/Profile/Modell
- Führt, sofern verfügbar, beide deklarierten Runtime-Modi aus:
generatemit reiner Prompt-Eingabeedit, wenn der Providercapabilities.edit.enableddeklariert
- Aktuelle Abdeckung der gemeinsamen Lane:
google:generate,editminimax:generatecomfy: separate Comfy-Live-Datei, nicht dieser gemeinsame Sweep
- Optionale Eingrenzung:
OPENCLAW_LIVE_MUSIC_GENERATION_PROVIDERS="google,minimax"OPENCLAW_LIVE_MUSIC_GENERATION_MODELS="google/lyria-3-clip-preview,minimax/music-2.6"
- Optionales Auth-Verhalten:
OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1, um Auth aus dem Profile-Store zu erzwingen und reine Env-Overrides zu ignorieren
Videogenerierung live
- Test:
extensions/video-generation-providers.live.test.ts - Aktivieren:
OPENCLAW_LIVE_TEST=1 pnpm test:live -- extensions/video-generation-providers.live.test.ts - Harness:
pnpm test:live:media video - Umfang:
- Testet den gemeinsamen Pfad für gebündelte Provider zur Videogenerierung
- Verwendet standardmäßig den release-sicheren Smoke-Pfad: Nicht-FAL-Provider, eine Text-zu-Video-Anfrage pro Provider, ein einsekündiger Lobster-Prompt und ein operationsbezogenes Limit pro Provider aus
OPENCLAW_LIVE_VIDEO_GENERATION_TIMEOUT_MS(standardmäßig180000) - Überspringt FAL standardmäßig, weil die Queue-Latenz auf Provider-Seite die Release-Zeit dominieren kann; übergeben Sie
--video-providers faloderOPENCLAW_LIVE_VIDEO_GENERATION_PROVIDERS="fal", um FAL explizit auszuführen - Lädt Provider-Env-Vars vor dem Probing aus Ihrer Login-Shell (
~/.profile) - Verwendet standardmäßig Live-/Env-API-Schlüssel vor gespeicherten Auth-Profilen, damit veraltete Testschlüssel in
auth-profiles.jsonkeine echten Shell-Zugangsdaten verdecken - Überspringt Provider ohne nutzbare Auth/Profile/Modell
- Führt standardmäßig nur
generateaus - Setzen Sie
OPENCLAW_LIVE_VIDEO_GENERATION_FULL_MODES=1, um auch deklarierte Transformationsmodi auszuführen, sofern verfügbar:imageToVideo, wenn der Providercapabilities.imageToVideo.enableddeklariert und der ausgewählte Provider/das ausgewählte Modell im gemeinsamen Sweep lokale, buffer-gestützte Bildeingaben akzeptiertvideoToVideo, wenn der Providercapabilities.videoToVideo.enableddeklariert und der ausgewählte Provider/das ausgewählte Modell im gemeinsamen Sweep lokale, buffer-gestützte Videoeingaben akzeptiert
- Aktuelle deklarierte, aber im gemeinsamen Sweep übersprungene
imageToVideo-Provider:vydra, weil das gebündelteveo3nur Text unterstützt und das gebündelteklingeine Remote-Bild-URL erfordert
- Provider-spezifische Vydra-Abdeckung:
OPENCLAW_LIVE_TEST=1 OPENCLAW_LIVE_VYDRA_VIDEO=1 pnpm test:live -- extensions/vydra/vydra.live.test.ts- diese Datei führt
veo3Text-zu-Video sowie einekling-Lane aus, die standardmäßig eine Remote-Bild-URL-Fixture verwendet
- Aktuelle
videoToVideo-Live-Abdeckung:runwaynur, wenn das ausgewählte Modellrunway/gen4_alephist
- Aktuelle deklarierte, aber im gemeinsamen Sweep übersprungene
videoToVideo-Provider:alibaba,qwen,xai, weil diese Pfade derzeit Remote-http(s)-/MP4-Referenz-URLs erforderngoogle, weil die aktuelle gemeinsame Gemini-/Veo-Lane lokale, buffer-gestützte Eingaben verwendet und dieser Pfad im gemeinsamen Sweep nicht akzeptiert wirdopenai, weil der aktuellen gemeinsamen Lane organisationsspezifische Zugriffsgarantien für Video-Inpainting/-Remixing fehlen
- Optionale Eingrenzung:
OPENCLAW_LIVE_VIDEO_GENERATION_PROVIDERS="deepinfra,google,openai,runway"OPENCLAW_LIVE_VIDEO_GENERATION_MODELS="google/veo-3.1-fast-generate-preview,openai/sora-2,runway/gen4_aleph"OPENCLAW_LIVE_VIDEO_GENERATION_SKIP_PROVIDERS="", um jeden Provider in den Standard-Sweep einzubeziehen, einschließlich FALOPENCLAW_LIVE_VIDEO_GENERATION_TIMEOUT_MS=60000, um das Operationslimit pro Provider für einen aggressiven Smoke-Lauf zu reduzieren
- Optionales Auth-Verhalten:
OPENCLAW_LIVE_REQUIRE_PROFILE_KEYS=1, um Auth aus dem Profile-Store zu erzwingen und reine Env-Overrides zu ignorieren
Medien-Live-Harness
- Befehl:
pnpm test:live:media - Zweck:
- Führt die gemeinsamen Live-Suiten für Bild, Musik und Video über einen repo-nativen Einstiegspunkt aus
- Lädt fehlende Provider-Env-Vars automatisch aus
~/.profile - Grenzt jede Suite standardmäßig automatisch auf Provider ein, die derzeit nutzbare Auth haben
- Verwendet
scripts/test-live.mjswieder, sodass Heartbeat- und Quiet-Mode-Verhalten konsistent bleiben
- Beispiele:
pnpm test:live:mediapnpm test:live:media image video --providers openai,google,minimaxpnpm test:live:media video --video-providers openai,runway --all-providerspnpm test:live:media music --quiet
Verwandt
- Testing - Unit-, Integrations-, QA- und Docker-Suiten