Pour l’installation, la configuration et le dépannage, consultez Browser. Cette page est la référence pour l’API HTTP de contrôle local, la CLIDocumentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
openclaw browser
et les modèles de scripts (instantanés, refs, attentes, flux de débogage).
API de contrôle (facultative)
Pour les intégrations locales uniquement, le Gateway expose une petite API HTTP loopback :- État/démarrage/arrêt :
GET /,POST /start,POST /stop - Onglets :
GET /tabs,POST /tabs/open,POST /tabs/focus,DELETE /tabs/:targetId - Instantané/capture d’écran :
GET /snapshot,POST /screenshot - Actions :
POST /navigate,POST /act - Hooks :
POST /hooks/file-chooser,POST /hooks/dialog - Téléchargements :
POST /download,POST /wait/download - Autorisations :
POST /permissions/grant - Débogage :
GET /console,POST /pdf - Débogage :
GET /errors,GET /requests,POST /trace/start,POST /trace/stop,POST /highlight - Réseau :
POST /response/body - État :
GET /cookies,POST /cookies/set,POST /cookies/clear - État :
GET /storage/:kind,POST /storage/:kind/set,POST /storage/:kind/clear - Paramètres :
POST /set/offline,POST /set/headers,POST /set/credentials,POST /set/geolocation,POST /set/media,POST /set/timezone,POST /set/locale,POST /set/device
?profile=<name>. POST /start?headless=true demande un
lancement headless local ponctuel pour les profils gérés localement sans modifier la configuration
persistante du navigateur ; les profils attach-only, CDP distants et existing-session refusent
cette surcharge, car OpenClaw ne lance pas ces processus de navigateur.
Si l’authentification du Gateway par secret partagé est configurée, les routes HTTP du navigateur exigent aussi une authentification :
Authorization: Bearer <gateway token>x-openclaw-password: <gateway password>ou l’authentification HTTP Basic avec ce mot de passe
- Cette API de navigateur loopback autonome ne consomme pas les en-têtes d’identité trusted-proxy ou Tailscale Serve.
- Si
gateway.auth.modevautnoneoutrusted-proxy, ces routes de navigateur loopback n’héritent pas de ces modes porteurs d’identité ; gardez-les réservées au loopback.
Contrat d’erreur de /act
POST /act utilise une réponse d’erreur structurée pour la validation au niveau de la route et
les échecs de politique :
code :
ACT_KIND_REQUIRED(HTTP 400) :kindest manquant ou non reconnu.ACT_INVALID_REQUEST(HTTP 400) : la charge utile de l’action a échoué à la normalisation ou à la validation.ACT_SELECTOR_UNSUPPORTED(HTTP 400) :selectora été utilisé avec un type d’action non pris en charge.ACT_EVALUATE_DISABLED(HTTP 403) :evaluate(ouwait --fn) est désactivé par la configuration.ACT_TARGET_ID_MISMATCH(HTTP 403) : letargetIdde premier niveau ou groupé entre en conflit avec la cible de la requête.ACT_EXISTING_SESSION_UNSUPPORTED(HTTP 501) : l’action n’est pas prise en charge pour les profils existing-session.
{ "error": "<message>" } sans champ
code.
Exigence Playwright
Certaines fonctionnalités (navigate/act/instantané IA/instantané de rôle, captures d’écran d’éléments, PDF) nécessitent Playwright. Si Playwright n’est pas installé, ces points de terminaison renvoient une erreur 501 claire. Ce qui fonctionne encore sans Playwright :- Instantanés ARIA
- Instantanés d’accessibilité de style rôle (
--interactive,--compact,--depth,--efficient) lorsqu’un WebSocket CDP par onglet est disponible. Il s’agit d’un repli pour l’inspection et la découverte de refs ; Playwright reste le moteur d’action principal. - Captures d’écran de page pour le navigateur
openclawgéré lorsqu’un WebSocket CDP par onglet est disponible - Captures d’écran de page pour les profils
existing-session/ Chrome MCP - Captures d’écran basées sur des refs
existing-session(--ref) depuis la sortie d’instantané
navigateact- Les instantanés IA qui dépendent du format d’instantané IA natif de Playwright
- Les captures d’écran d’éléments par sélecteur CSS (
--element) - l’export PDF complet du navigateur
--full-page ; la route renvoie fullPage is not supported for element screenshots.
Si vous voyez Playwright is not available in this gateway build, il manque au Gateway empaqueté
la dépendance d’exécution principale du navigateur. Réinstallez ou mettez à jour
OpenClaw, puis redémarrez le gateway. Pour Docker, installez aussi les binaires du navigateur
Chromium comme indiqué ci-dessous.
Installation Docker de Playwright
Si votre Gateway s’exécute dans Docker, éviteznpx playwright (conflits de surcharge npm).
Pour les images personnalisées, intégrez Chromium à l’image :
PLAYWRIGHT_BROWSERS_PATH (par exemple,
/home/node/.cache/ms-playwright) et assurez-vous que /home/node est persisté via
OPENCLAW_HOME_VOLUME ou un montage bind. OpenClaw détecte automatiquement le Chromium persisté
sous Linux. Consultez Docker.
Fonctionnement (interne)
Un petit serveur de contrôle loopback accepte les requêtes HTTP et se connecte aux navigateurs basés sur Chromium via CDP. Les actions avancées (click/type/snapshot/PDF) passent par Playwright au-dessus de CDP ; lorsque Playwright est absent, seules les opérations qui ne dépendent pas de Playwright sont disponibles. L’agent voit une interface stable unique tandis que les navigateurs et profils locaux/distants peuvent être remplacés librement en dessous.Référence rapide de la CLI
Toutes les commandes acceptent--browser-profile <name> pour cibler un profil spécifique, et --json pour une sortie lisible par machine.
Basics: status, tabs, open/focus/close
Basics: status, tabs, open/focus/close
Inspection: screenshot, snapshot, console, errors, requests
Inspection: screenshot, snapshot, console, errors, requests
Actions: navigate, click, type, drag, wait, evaluate
Actions: navigate, click, type, drag, wait, evaluate
State: cookies, storage, offline, headers, geo, device
State: cookies, storage, offline, headers, geo, device
uploadetdialogsont des appels d’armement ; exécutez-les avant le clic/la pression qui déclenche le sélecteur/la boîte de dialogue.click/type/etc nécessitent unerefprovenant desnapshot(12numérique, ref de rôlee12ou ref ARIA actionnableax12). Les sélecteurs CSS ne sont volontairement pas pris en charge pour les actions. Utilisezclick-coordslorsque la position visible dans la fenêtre d’affichage est la seule cible fiable.- Les chemins de téléchargement, trace et upload sont limités aux racines temporaires OpenClaw :
/tmp/openclaw{,/downloads,/uploads}(repli :${os.tmpdir()}/openclaw/...). uploadpeut aussi définir directement les entrées de fichier via--input-refou--element.
suggestedTargetId depuis tabs dans les scripts.
Aperçu des indicateurs d’instantané :
--format ai(par défaut avec Playwright) : instantané IA avec refs numériques (aria-ref="<n>").--format aria: arbre d’accessibilité avec refsaxN. Lorsque Playwright est disponible, OpenClaw lie les refs avec des identifiants DOM backend à la page en direct afin que les actions suivantes puissent les utiliser ; sinon, considérez la sortie comme réservée à l’inspection.--efficient(ou--mode efficient) : préréglage compact d’instantané de rôle. Définissezbrowser.snapshotDefaults.mode: "efficient"pour en faire la valeur par défaut (voir configuration du Gateway).--interactive,--compact,--depth,--selectorforcent un instantané de rôle avec des refsref=e12.--frame "<iframe>"limite les instantanés de rôle à une iframe.--labelsajoute une capture d’écran limitée à la fenêtre d’affichage avec des libellés de refs superposés (afficheMEDIA:<path>).--urlsajoute les destinations de liens découvertes aux instantanés IA.
Instantanés et refs
OpenClaw prend en charge deux styles d’« instantané » :-
Instantané IA (refs numériques) :
openclaw browser snapshot(par défaut ;--format ai)- Sortie : un instantané texte qui inclut des refs numériques.
- Actions :
openclaw browser click 12,openclaw browser type 23 "hello". - En interne, la ref est résolue via
aria-refde Playwright.
-
Instantané de rôle (refs de rôle comme
e12) :openclaw browser snapshot --interactive(ou--compact,--depth,--selector,--frame)- Sortie : une liste/arborescence basée sur les rôles avec
[ref=e12](et[nth=1]facultatif). - Actions :
openclaw browser click e12,openclaw browser highlight e12. - En interne, la ref est résolue via
getByRole(...)(plusnth()pour les doublons). - Ajoutez
--labelspour inclure une capture d’écran de la fenêtre d’affichage avec des libellése12superposés. - Ajoutez
--urlslorsque le texte du lien est ambigu et que l’agent a besoin de cibles de navigation concrètes.
- Sortie : une liste/arborescence basée sur les rôles avec
-
Instantané ARIA (réfs ARIA comme
ax12) :openclaw browser snapshot --format aria- Sortie : l’arbre d’accessibilité sous forme de nœuds structurés.
- Actions :
openclaw browser click ax12fonctionne lorsque le chemin de l’instantané peut lier la réf via les ids DOM du backend Playwright et Chrome.
-
Si Playwright n’est pas disponible, les instantanés ARIA peuvent tout de même être utiles pour
l’inspection, mais les réfs peuvent ne pas être utilisables pour des actions. Reprenez un instantané avec
--format aiou--interactivelorsque vous avez besoin de réfs d’action. -
Preuve Docker pour le chemin de repli raw-CDP :
pnpm test:docker:browser-cdp-snapshotdémarre Chromium avec CDP, exécutebrowser doctor --deep, et vérifie que les instantanés de rôles incluent les URL de liens, les éléments cliquables promus par le curseur, et les métadonnées d’iframe.
- Les réfs ne sont pas stables entre les navigations ; si quelque chose échoue, relancez
snapshotet utilisez une réf fraîche. /actrenvoie letargetIdbrut actuel après un remplacement déclenché par une action lorsqu’il peut prouver l’onglet de remplacement. Continuez à utiliser des ids/étiquettes d’onglet stables pour les commandes de suivi.- Si l’instantané de rôles a été pris avec
--frame, les réfs de rôles sont limitées à cet iframe jusqu’au prochain instantané de rôles. - Les réfs
axNinconnues ou obsolètes échouent rapidement au lieu de retomber sur le sélecteuraria-refde Playwright. Exécutez un nouvel instantané sur le même onglet lorsque cela se produit.
Capacités d’attente avancées
Vous pouvez attendre plus que simplement du temps/texte :- Attendre une URL (globs pris en charge par Playwright) :
openclaw browser wait --url "**/dash"
- Attendre l’état de chargement :
openclaw browser wait --load networkidle
- Attendre un prédicat JS :
openclaw browser wait --fn "window.ready===true"
- Attendre qu’un sélecteur devienne visible :
openclaw browser wait "#main"
Flux de débogage
Lorsqu’une action échoue (par exemple « non visible », « violation du mode strict », « recouvert ») :openclaw browser snapshot --interactive- Utilisez
click <ref>/type <ref>(privilégiez les réfs de rôles en mode interactif) - Si l’échec persiste :
openclaw browser highlight <ref>pour voir ce que Playwright cible - Si la page se comporte étrangement :
openclaw browser errors --clearopenclaw browser requests --filter api --clear
- Pour un débogage approfondi : enregistrez une trace :
openclaw browser trace start- reproduisez le problème
openclaw browser trace stop(afficheTRACE:<path>)
Sortie JSON
--json est destiné aux scripts et aux outils structurés.
Exemples :
refs ainsi qu’un petit bloc stats (lines/chars/refs/interactive) afin que les outils puissent raisonner sur la taille et la densité de la charge utile.
Options d’état et d’environnement
Elles sont utiles pour les flux « faire en sorte que le site se comporte comme X » :- Cookies :
cookies,cookies set,cookies clear - Stockage :
storage local|session get|set|clear - Hors ligne :
set offline on|off - En-têtes :
set headers --headers-json '{"X-Debug":"1"}'(l’ancienset headers --json '{"X-Debug":"1"}'reste pris en charge) - Authentification HTTP basic :
set credentials user pass(ou--clear) - Géolocalisation :
set geo <lat> <lon> --origin "https://example.com"(ou--clear) - Média :
set media dark|light|no-preference|none - Fuseau horaire / locale :
set timezone ...,set locale ... - Appareil / zone d’affichage :
set device "iPhone 14"(préréglages d’appareils Playwright)set viewport 1280 720
Sécurité et confidentialité
- Le profil de navigateur openclaw peut contenir des sessions connectées ; traitez-le comme sensible.
browser act kind=evaluate/openclaw browser evaluateetwait --fnexécutent du JavaScript arbitraire dans le contexte de la page. L’injection de prompt peut orienter cela. Désactivez-le avecbrowser.evaluateEnabled=falsesi vous n’en avez pas besoin.- Pour les connexions et les notes anti-bot (X/Twitter, etc.), consultez Connexion navigateur + publication X/Twitter.
- Gardez l’hôte Gateway/Node privé (loopback ou tailnet-only).
- Les points de terminaison CDP distants sont puissants ; tunnelisez-les et protégez-les.
Connexe
- Navigateur - vue d’ensemble, configuration, profils, sécurité
- Connexion navigateur - connexion à des sites
- Dépannage navigateur Linux
- Dépannage navigateur WSL2