Für Einrichtung, Konfiguration und Fehlerbehebung siehe Browser. Diese Seite ist die Referenz für die lokale Steuerungs-HTTP-API, dieDocumentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
openclaw browser
CLI und Scripting-Muster (Snapshots, Refs, Wartevorgänge, Debug-Flows).
Steuerungs-API (optional)
Nur für lokale Integrationen stellt der Gateway eine kleine loopback-HTTP-API bereit:- Status/Start/Stopp:
GET /,POST /start,POST /stop - Tabs:
GET /tabs,POST /tabs/open,POST /tabs/focus,DELETE /tabs/:targetId - Snapshot/Screenshot:
GET /snapshot,POST /screenshot - Aktionen:
POST /navigate,POST /act - Hooks:
POST /hooks/file-chooser,POST /hooks/dialog - Downloads:
POST /download,POST /wait/download - Berechtigungen:
POST /permissions/grant - Debugging:
GET /console,POST /pdf - Debugging:
GET /errors,GET /requests,POST /trace/start,POST /trace/stop,POST /highlight - Netzwerk:
POST /response/body - Zustand:
GET /cookies,POST /cookies/set,POST /cookies/clear - Zustand:
GET /storage/:kind,POST /storage/:kind/set,POST /storage/:kind/clear - Einstellungen:
POST /set/offline,POST /set/headers,POST /set/credentials,POST /set/geolocation,POST /set/media,POST /set/timezone,POST /set/locale,POST /set/device
?profile=<name>. POST /start?headless=true fordert einen
einmaligen headless-Start für lokal verwaltete Profile an, ohne die dauerhaft gespeicherte
Browser-Konfiguration zu ändern; attach-only-, Remote-CDP- und Existing-Session-Profile lehnen
diese Überschreibung ab, weil OpenClaw diese Browser-Prozesse nicht startet.
Wenn Gateway-Authentifizierung per gemeinsamem Geheimnis konfiguriert ist, erfordern Browser-HTTP-Routen ebenfalls Authentifizierung:
Authorization: Bearer <gateway token>x-openclaw-password: <gateway password>oder HTTP Basic Auth mit diesem Passwort
- Diese eigenständige loopback-Browser-API nutzt keine trusted-proxy- oder Tailscale-Serve-Identitätsheader.
- Wenn
gateway.auth.modeaufnoneodertrusted-proxygesetzt ist, erben diese loopback-Browser- Routen diese identitätstragenden Modi nicht; halten Sie sie ausschließlich loopback-lokal.
Fehlervertrag für /act
POST /act verwendet eine strukturierte Fehlerantwort für Validierung auf Routenebene und
Policy-Fehler:
code-Werte:
ACT_KIND_REQUIRED(HTTP 400):kindfehlt oder wird nicht erkannt.ACT_INVALID_REQUEST(HTTP 400): Die Aktionsnutzlast konnte nicht normalisiert oder validiert werden.ACT_SELECTOR_UNSUPPORTED(HTTP 400):selectorwurde mit einer nicht unterstützten Aktionsart verwendet.ACT_EVALUATE_DISABLED(HTTP 403):evaluate(oderwait --fn) ist durch die Konfiguration deaktiviert.ACT_TARGET_ID_MISMATCH(HTTP 403):targetIdauf oberster Ebene oder in einem Batch steht im Konflikt mit dem Request-Ziel.ACT_EXISTING_SESSION_UNSUPPORTED(HTTP 501): Die Aktion wird für Existing-Session-Profile nicht unterstützt.
{ "error": "<message>" } ohne ein
code-Feld zurückgeben.
Playwright-Anforderung
Einige Funktionen (navigate/act/AI-Snapshot/Rollen-Snapshot, Element-Screenshots, PDF) erfordern Playwright. Wenn Playwright nicht installiert ist, geben diese Endpunkte einen klaren 501-Fehler zurück. Was ohne Playwright weiterhin funktioniert:- ARIA-Snapshots
- Rollenbasierte Accessibility-Snapshots (
--interactive,--compact,--depth,--efficient), wenn ein CDP-WebSocket pro Tab verfügbar ist. Dies ist ein Fallback für Inspektion und Ref-Ermittlung; Playwright bleibt die primäre Aktions-Engine. - Seiten-Screenshots für den verwalteten
openclaw-Browser, wenn ein CDP- WebSocket pro Tab verfügbar ist - Seiten-Screenshots für
existing-session- / Chrome-MCP-Profile existing-session-Ref-basierte Screenshots (--ref) aus der Snapshot-Ausgabe
navigateact- AI-Snapshots, die vom nativen AI-Snapshot-Format von Playwright abhängen
- CSS-Selektor-Element-Screenshots (
--element) - vollständiger Browser-PDF-Export
--full-page ab; die Route gibt fullPage is not supported for element screenshots zurück.
Wenn Sie Playwright is not available in this gateway build sehen, fehlt dem paketierten
Gateway die zentrale Browser-Laufzeitabhängigkeit. Installieren oder aktualisieren Sie
OpenClaw neu und starten Sie anschließend den Gateway neu. Für Docker installieren Sie außerdem
die Chromium-Browser-Binärdateien wie unten gezeigt.
Docker-Playwright-Installation
Wenn Ihr Gateway in Docker läuft, vermeiden Sienpx playwright (npm-Override-Konflikte).
Für benutzerdefinierte Images backen Sie Chromium in das Image ein:
PLAYWRIGHT_BROWSERS_PATH (zum Beispiel
/home/node/.cache/ms-playwright) und stellen Sie sicher, dass /home/node über
OPENCLAW_HOME_VOLUME oder einen Bind Mount persistent ist. OpenClaw erkennt das persistente
Chromium unter Linux automatisch. Siehe Docker.
Funktionsweise (intern)
Ein kleiner loopback-Steuerungsserver akzeptiert HTTP-Requests und verbindet sich per CDP mit Chromium-basierten Browsern. Erweiterte Aktionen (click/type/snapshot/PDF) laufen über Playwright auf CDP; wenn Playwright fehlt, sind nur Nicht-Playwright-Vorgänge verfügbar. Der Agent sieht eine stabile Schnittstelle, während lokale/remote Browser und Profile darunter frei ausgetauscht werden.CLI-Kurzreferenz
Alle Befehle akzeptieren--browser-profile <name>, um ein bestimmtes Profil anzusteuern, und --json für maschinenlesbare Ausgabe.
Basics: status, tabs, open/focus/close
Basics: status, tabs, open/focus/close
Inspection: screenshot, snapshot, console, errors, requests
Inspection: screenshot, snapshot, console, errors, requests
Actions: navigate, click, type, drag, wait, evaluate
Actions: navigate, click, type, drag, wait, evaluate
State: cookies, storage, offline, headers, geo, device
State: cookies, storage, offline, headers, geo, device
uploadunddialogsind vorbereitende Aufrufe; führen Sie sie vor dem Klick/Tastendruck aus, der den Chooser/Dialog auslöst.click/type/etc erfordern einerefaussnapshot(numerisch12, Rollen-Refe12oder ausführbare ARIA-Refax12). CSS-Selektoren werden für Aktionen absichtlich nicht unterstützt. Verwenden Sieclick-coords, wenn die sichtbare Viewport-Position das einzige zuverlässige Ziel ist.- Download-, Trace- und Upload-Pfade sind auf OpenClaw-Temp-Roots beschränkt:
/tmp/openclaw{,/downloads,/uploads}(Fallback:${os.tmpdir()}/openclaw/...). uploadkann Datei-Inputs auch direkt über--input-refoder--elementsetzen.
suggestedTargetId aus tabs in Skripten.
Snapshot-Flags auf einen Blick:
--format ai(Standard mit Playwright): AI-Snapshot mit numerischen Refs (aria-ref="<n>").--format aria: Accessibility-Baum mitaxN-Refs. Wenn Playwright verfügbar ist, bindet OpenClaw Refs mit Backend-DOM-IDs an die Live-Seite, sodass Folgeaktionen sie verwenden können; andernfalls behandeln Sie die Ausgabe als reine Inspektion.--efficient(oder--mode efficient): kompakte Rollen-Snapshot-Voreinstellung. Setzen Siebrowser.snapshotDefaults.mode: "efficient", um dies zum Standard zu machen (siehe Gateway-Konfiguration).--interactive,--compact,--depth,--selectorerzwingen einen Rollen-Snapshot mitref=e12-Refs.--frame "<iframe>"beschränkt Rollen-Snapshots auf ein iframe.--labelsfügt einen Viewport-only-Screenshot mit überlagerten Ref-Labels hinzu (gibtMEDIA:<path>aus).--urlshängt gefundene Link-Ziele an AI-Snapshots an.
Snapshots und Refs
OpenClaw unterstützt zwei „Snapshot“-Stile:-
AI-Snapshot (numerische Refs):
openclaw browser snapshot(Standard;--format ai)- Ausgabe: ein Text-Snapshot, der numerische Refs enthält.
- Aktionen:
openclaw browser click 12,openclaw browser type 23 "hello". - Intern wird die Ref über Playwrights
aria-refaufgelöst.
-
Rollen-Snapshot (Rollen-Refs wie
e12):openclaw browser snapshot --interactive(oder--compact,--depth,--selector,--frame)- Ausgabe: eine rollenbasierte Liste/Baumstruktur mit
[ref=e12](und optional[nth=1]). - Aktionen:
openclaw browser click e12,openclaw browser highlight e12. - Intern wird die Ref über
getByRole(...)aufgelöst (plusnth()für Duplikate). - Fügen Sie
--labelshinzu, um einen Viewport-Screenshot mit überlagertene12-Labels einzuschließen. - Fügen Sie
--urlshinzu, wenn Linktext mehrdeutig ist und der Agent konkrete Navigationsziele benötigt.
- Ausgabe: eine rollenbasierte Liste/Baumstruktur mit
-
ARIA-Snapshot (ARIA-Refs wie
ax12):openclaw browser snapshot --format aria- Ausgabe: der Barrierefreiheitsbaum als strukturierte Nodes.
- Aktionen:
openclaw browser click ax12funktioniert, wenn der Snapshot-Pfad den Ref über Playwright und DOM-IDs des Chrome-Backends binden kann.
-
Wenn Playwright nicht verfügbar ist, können ARIA-Snapshots für die
Inspektion trotzdem nützlich sein, aber Refs sind möglicherweise nicht ausführbar. Erstellen Sie erneut einen Snapshot mit
--format aioder--interactive, wenn Sie Aktions-Refs benötigen. -
Docker-Nachweis für den Raw-CDP-Fallback-Pfad:
pnpm test:docker:browser-cdp-snapshotstartet Chromium mit CDP, führtbrowser doctor --deepaus und verifiziert, dass Rollen-Snapshots Link-URLs, durch den Cursor hervorgehobene anklickbare Elemente und iframe-Metadaten enthalten.
- Refs sind über Navigationen hinweg nicht stabil; wenn etwas fehlschlägt, führen Sie
snapshoterneut aus und verwenden Sie einen frischen Ref. /actgibt nach einer durch eine Aktion ausgelösten Ersetzung die aktuelle rohetargetIdzurück, wenn der Ersatz-Tab eindeutig nachgewiesen werden kann. Verwenden Sie für Folgekommandos weiterhin stabile Tab-IDs/-Labels.- Wenn der Rollen-Snapshot mit
--frameerstellt wurde, sind Rollen-Refs bis zum nächsten Rollen-Snapshot auf dieses iframe beschränkt. - Unbekannte oder veraltete
axN-Refs schlagen schnell fehl, statt auf denaria-ref-Selektor von Playwright zurückzufallen. Führen Sie in diesem Fall einen frischen Snapshot auf demselben Tab aus.
Wait-Erweiterungen
Sie können auf mehr als nur Zeit/Text warten:- Auf URL warten (Globs werden von Playwright unterstützt):
openclaw browser wait --url "**/dash"
- Auf Ladezustand warten:
openclaw browser wait --load networkidle
- Auf ein JS-Prädikat warten:
openclaw browser wait --fn "window.ready===true"
- Darauf warten, dass ein Selektor sichtbar wird:
openclaw browser wait "#main"
Debug-Workflows
Wenn eine Aktion fehlschlägt (z. B. „not visible“, „strict mode violation“, „covered“):openclaw browser snapshot --interactive- Verwenden Sie
click <ref>/type <ref>(bevorzugen Sie Rollen-Refs im interaktiven Modus) - Wenn es weiterhin fehlschlägt:
openclaw browser highlight <ref>, um zu sehen, worauf Playwright zielt - Wenn sich die Seite ungewöhnlich verhält:
openclaw browser errors --clearopenclaw browser requests --filter api --clear
- Für tiefgehendes Debugging: Zeichnen Sie einen Trace auf:
openclaw browser trace start- Reproduzieren Sie das Problem
openclaw browser trace stop(gibtTRACE:<path>aus)
JSON-Ausgabe
--json ist für Skripting und strukturierte Tools gedacht.
Beispiele:
refs plus einen kleinen stats-Block (Zeilen/Zeichen/Refs/interaktiv), damit Tools über Payload-Größe und -Dichte entscheiden können.
Stellschrauben für Zustand und Umgebung
Diese sind nützlich für Workflows nach dem Muster „die Website soll sich wie X verhalten“:- Cookies:
cookies,cookies set,cookies clear - Storage:
storage local|session get|set|clear - Offline:
set offline on|off - Header:
set headers --headers-json '{"X-Debug":"1"}'(das Legacy-Formatset headers --json '{"X-Debug":"1"}'wird weiterhin unterstützt) - HTTP-Basic-Auth:
set credentials user pass(oder--clear) - Geolokalisierung:
set geo <lat> <lon> --origin "https://example.com"(oder--clear) - Medien:
set media dark|light|no-preference|none - Zeitzone / Locale:
set timezone ...,set locale ... - Gerät / Viewport:
set device "iPhone 14"(Playwright-Geräte-Presets)set viewport 1280 720
Sicherheit und Datenschutz
- Das openclaw-Browser-Profil kann angemeldete Sitzungen enthalten; behandeln Sie es als sensibel.
browser act kind=evaluate/openclaw browser evaluateundwait --fnführen beliebiges JavaScript im Seitenkontext aus. Prompt Injection kann dies steuern. Deaktivieren Sie es mitbrowser.evaluateEnabled=false, wenn Sie es nicht benötigen.- Hinweise zu Anmeldungen und Anti-Bot (X/Twitter usw.) finden Sie unter Browser-Anmeldung + Posten auf X/Twitter.
- Halten Sie den Gateway-/Node-Host privat (loopback oder nur tailnet).
- Remote-CDP-Endpunkte sind leistungsfähig; tunneln und schützen Sie sie.
Weitere Informationen
- Browser - Überblick, Konfiguration, Profile, Sicherheit
- Browser-Anmeldung - Anmeldung bei Websites
- Browser-Linux-Fehlerbehebung
- Browser-WSL2-Fehlerbehebung