Para configuración, ajustes y solución de problemas, consulta Browser. Esta página es la referencia para la API HTTP de control local, la CLIDocumentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
openclaw browser
y los patrones de scripting (instantáneas, referencias, esperas, flujos de depuración).
API de control (opcional)
Solo para integraciones locales, el Gateway expone una pequeña API HTTP de loopback:- Estado/inicio/detención:
GET /,POST /start,POST /stop - Pestañas:
GET /tabs,POST /tabs/open,POST /tabs/focus,DELETE /tabs/:targetId - Instantánea/captura de pantalla:
GET /snapshot,POST /screenshot - Acciones:
POST /navigate,POST /act - Hooks:
POST /hooks/file-chooser,POST /hooks/dialog - Descargas:
POST /download,POST /wait/download - Permisos:
POST /permissions/grant - Depuración:
GET /console,POST /pdf - Depuración:
GET /errors,GET /requests,POST /trace/start,POST /trace/stop,POST /highlight - Red:
POST /response/body - Estado:
GET /cookies,POST /cookies/set,POST /cookies/clear - Estado:
GET /storage/:kind,POST /storage/:kind/set,POST /storage/:kind/clear - Configuración:
POST /set/offline,POST /set/headers,POST /set/credentials,POST /set/geolocation,POST /set/media,POST /set/timezone,POST /set/locale,POST /set/device
?profile=<name>. POST /start?headless=true solicita un
inicio headless de un solo uso para perfiles administrados locales sin cambiar la
configuración persistida del navegador; los perfiles de solo adjuntar, CDP remoto
y sesión existente rechazan esa anulación porque OpenClaw no inicia esos procesos
del navegador.
Si la autenticación del Gateway con secreto compartido está configurada, las rutas HTTP del navegador también requieren autenticación:
Authorization: Bearer <gateway token>x-openclaw-password: <gateway password>o autenticación HTTP Basic con esa contraseña
- Esta API independiente de navegador por loopback no consume encabezados de identidad de proxy de confianza ni de Tailscale Serve.
- Si
gateway.auth.modeesnoneotrusted-proxy, estas rutas de navegador por loopback no heredan esos modos que portan identidad; mantenlas solo para loopback.
Contrato de error de /act
POST /act usa una respuesta de error estructurada para validación a nivel de ruta y
fallos de política:
code:
ACT_KIND_REQUIRED(HTTP 400): faltakindo no se reconoce.ACT_INVALID_REQUEST(HTTP 400): la carga de acción no superó la normalización o la validación.ACT_SELECTOR_UNSUPPORTED(HTTP 400): se usóselectorcon un tipo de acción no admitido.ACT_EVALUATE_DISABLED(HTTP 403):evaluate(owait --fn) está deshabilitado por configuración.ACT_TARGET_ID_MISMATCH(HTTP 403): eltargetIdde nivel superior o por lotes entra en conflicto con el destino de la solicitud.ACT_EXISTING_SESSION_UNSUPPORTED(HTTP 501): la acción no es compatible con perfiles de sesión existente.
{ "error": "<message>" } sin un
campo code.
Requisito de Playwright
Algunas funciones (navigate/act/instantánea de IA/instantánea de roles, capturas de pantalla de elementos, PDF) requieren Playwright. Si Playwright no está instalado, esos endpoints devuelven un error 501 claro. Lo que sigue funcionando sin Playwright:- Instantáneas ARIA
- Instantáneas de accesibilidad de estilo rol (
--interactive,--compact,--depth,--efficient) cuando hay disponible un WebSocket CDP por pestaña. Esto es una alternativa para inspección y descubrimiento de referencias; Playwright sigue siendo el motor de acciones principal. - Capturas de pantalla de página para el navegador administrado
openclawcuando hay disponible un WebSocket CDP por pestaña - Capturas de pantalla de página para perfiles
existing-session/ Chrome MCP - Capturas de pantalla basadas en referencias de
existing-session(--ref) desde la salida de instantánea
navigateact- Instantáneas de IA que dependen del formato nativo de instantánea de IA de Playwright
- Capturas de pantalla de elementos con selectores CSS (
--element) - exportación completa de PDF del navegador
--full-page; la ruta devuelve fullPage is not supported for element screenshots.
Si ves Playwright is not available in this gateway build, al Gateway empaquetado
le falta la dependencia principal de tiempo de ejecución del navegador. Reinstala o actualiza
OpenClaw y luego reinicia el gateway. Para Docker, instala también los binarios del navegador
Chromium como se muestra a continuación.
Instalación de Playwright en Docker
Si tu Gateway se ejecuta en Docker, evitanpx playwright (conflictos de anulaciones de npm).
Para imágenes personalizadas, incorpora Chromium en la imagen:
PLAYWRIGHT_BROWSERS_PATH (por ejemplo,
/home/node/.cache/ms-playwright) y asegúrate de que /home/node se persista mediante
OPENCLAW_HOME_VOLUME o un montaje bind. OpenClaw detecta automáticamente el Chromium persistido
en Linux. Consulta Docker.
Cómo funciona (interno)
Un pequeño servidor de control por loopback acepta solicitudes HTTP y se conecta a navegadores basados en Chromium mediante CDP. Las acciones avanzadas (click/type/snapshot/PDF) pasan por Playwright sobre CDP; cuando falta Playwright, solo están disponibles las operaciones que no usan Playwright. El agente ve una interfaz estable mientras los navegadores y perfiles locales/remotos se intercambian libremente por debajo.Referencia rápida de la CLI
Todos los comandos aceptan--browser-profile <name> para apuntar a un perfil específico y --json para salida legible por máquina.
Basics: status, tabs, open/focus/close
Basics: status, tabs, open/focus/close
Inspection: screenshot, snapshot, console, errors, requests
Inspection: screenshot, snapshot, console, errors, requests
Actions: navigate, click, type, drag, wait, evaluate
Actions: navigate, click, type, drag, wait, evaluate
State: cookies, storage, offline, headers, geo, device
State: cookies, storage, offline, headers, geo, device
uploadydialogson llamadas de preparación; ejecútalas antes del click/press que activa el selector/diálogo.click/type/etc requieren unarefdesnapshot(12numérica, referencia de role12o referencia ARIA accionableax12). Los selectores CSS no son compatibles intencionalmente para acciones. Usaclick-coordscuando la posición visible en el viewport sea el único destino confiable.- Las rutas de descarga, trazado y carga están restringidas a las raíces temporales de OpenClaw:
/tmp/openclaw{,/downloads,/uploads}(alternativa:${os.tmpdir()}/openclaw/...). uploadtambién puede establecer entradas de archivo directamente mediante--input-refo--element.
suggestedTargetId de tabs en scripts.
Resumen de flags de instantánea:
--format ai(predeterminado con Playwright): instantánea de IA con referencias numéricas (aria-ref="<n>").--format aria: árbol de accesibilidad con referenciasaxN. Cuando Playwright está disponible, OpenClaw vincula referencias con ids DOM de backend a la página activa para que las acciones posteriores puedan usarlas; de lo contrario, trata la salida solo como inspección.--efficient(o--mode efficient): preajuste compacto de instantánea de rol. Establecebrowser.snapshotDefaults.mode: "efficient"para que sea el valor predeterminado (consulta configuración del Gateway).--interactive,--compact,--depth,--selectorfuerzan una instantánea de rol con referenciasref=e12.--frame "<iframe>"limita las instantáneas de rol a un iframe.--labelsagrega una captura de pantalla solo del viewport con etiquetas de referencia superpuestas (imprimeMEDIA:<path>).--urlsagrega destinos de enlaces descubiertos a las instantáneas de IA.
Instantáneas y referencias
OpenClaw admite dos estilos de “instantánea”:-
Instantánea de IA (referencias numéricas):
openclaw browser snapshot(predeterminado;--format ai)- Salida: una instantánea de texto que incluye referencias numéricas.
- Acciones:
openclaw browser click 12,openclaw browser type 23 "hello". - Internamente, la referencia se resuelve mediante
aria-refde Playwright.
-
Instantánea de rol (referencias de rol como
e12):openclaw browser snapshot --interactive(o--compact,--depth,--selector,--frame)- Salida: una lista/árbol basado en roles con
[ref=e12](y[nth=1]opcional). - Acciones:
openclaw browser click e12,openclaw browser highlight e12. - Internamente, la referencia se resuelve mediante
getByRole(...)(másnth()para duplicados). - Agrega
--labelspara incluir una captura de pantalla del viewport con etiquetase12superpuestas. - Agrega
--urlscuando el texto del enlace sea ambiguo y el agente necesite destinos de navegación concretos.
- Salida: una lista/árbol basado en roles con
-
Instantánea ARIA (referencias ARIA como
ax12):openclaw browser snapshot --format aria- Salida: el árbol de accesibilidad como nodos estructurados.
- Acciones:
openclaw browser click ax12funciona cuando la ruta de la instantánea puede vincular la referencia mediante Playwright y los id. de DOM del backend de Chrome.
-
Si Playwright no está disponible, las instantáneas ARIA aún pueden ser útiles para
la inspección, pero las referencias podrían no ser accionables. Vuelve a tomar una instantánea con
--format aio--interactivecuando necesites referencias de acción. -
Prueba de Docker para la ruta de reserva raw-CDP:
pnpm test:docker:browser-cdp-snapshotinicia Chromium con CDP, ejecutabrowser doctor --deepy verifica que las instantáneas de roles incluyan URL de enlaces, elementos clicables promovidos por cursor y metadatos de iframe.
- Las referencias no son estables entre navegaciones; si algo falla, vuelve a ejecutar
snapshoty usa una referencia nueva. /actdevuelve eltargetIdsin procesar actual después de un reemplazo activado por acción cuando puede demostrar la pestaña de reemplazo. Sigue usando id. o etiquetas de pestaña estables para los comandos posteriores.- Si la instantánea de roles se tomó con
--frame, las referencias de roles quedan limitadas a ese iframe hasta la siguiente instantánea de roles. - Las referencias
axNdesconocidas u obsoletas fallan rápido en lugar de recurrir al selectoraria-refde Playwright. Ejecuta una instantánea nueva en la misma pestaña cuando eso ocurra.
Mejoras de espera
Puedes esperar más que solo tiempo/texto:- Esperar URL (globs admitidos por Playwright):
openclaw browser wait --url "**/dash"
- Esperar estado de carga:
openclaw browser wait --load networkidle
- Esperar un predicado JS:
openclaw browser wait --fn "window.ready===true"
- Esperar a que un selector sea visible:
openclaw browser wait "#main"
Flujos de depuración
Cuando una acción falla (por ejemplo, “no visible”, “infracción de modo estricto”, “cubierto”):openclaw browser snapshot --interactive- Usa
click <ref>/type <ref>(prefiere referencias de roles en modo interactivo) - Si todavía falla:
openclaw browser highlight <ref>para ver a qué apunta Playwright - Si la página se comporta de forma extraña:
openclaw browser errors --clearopenclaw browser requests --filter api --clear
- Para depuración profunda: graba una traza:
openclaw browser trace start- reproduce el problema
openclaw browser trace stop(imprimeTRACE:<path>)
Salida JSON
--json es para scripts y herramientas estructuradas.
Ejemplos:
refs además de un pequeño bloque stats (lines/chars/refs/interactive) para que las herramientas puedan razonar sobre el tamaño y la densidad de la carga útil.
Controles de estado y entorno
Son útiles para flujos de trabajo de “hacer que el sitio se comporte como X”:- Cookies:
cookies,cookies set,cookies clear - Almacenamiento:
storage local|session get|set|clear - Sin conexión:
set offline on|off - Encabezados:
set headers --headers-json '{"X-Debug":"1"}'(elset headers --json '{"X-Debug":"1"}'heredado sigue siendo compatible) - Autenticación básica HTTP:
set credentials user pass(o--clear) - Geolocalización:
set geo <lat> <lon> --origin "https://example.com"(o--clear) - Medios:
set media dark|light|no-preference|none - Zona horaria / configuración regional:
set timezone ...,set locale ... - Dispositivo / viewport:
set device "iPhone 14"(preajustes de dispositivo de Playwright)set viewport 1280 720
Seguridad y privacidad
- El perfil de navegador de openclaw puede contener sesiones iniciadas; trátalo como información confidencial.
browser act kind=evaluate/openclaw browser evaluateywait --fnejecutan JavaScript arbitrario en el contexto de la página. La inyección de prompts puede dirigir esto. Desactívalo conbrowser.evaluateEnabled=falsesi no lo necesitas.- Para notas sobre inicios de sesión y antibot (X/Twitter, etc.), consulta Inicio de sesión en navegador + publicación en X/Twitter.
- Mantén privado el host de Gateway/node (loopback o solo tailnet).
- Los endpoints CDP remotos son potentes; protégelos y usa túneles.
Relacionado
- Navegador - descripción general, configuración, perfiles, seguridad
- Inicio de sesión en navegador - iniciar sesión en sitios
- Solución de problemas de Browser en Linux
- Solución de problemas de Browser en WSL2