Active Memory es un subagente de memoria bloqueante opcional propiedad del Plugin que se ejecuta antes de la respuesta principal en las sesiones conversacionales aptas. Existe porque la mayoría de los sistemas de memoria son capaces, pero reactivos. Dependen de que el agente principal decida cuándo buscar en la memoria, o de que el usuario diga cosas como “recuerda esto” o “busca en la memoria”. Para entonces, el momento en que la memoria habría hecho que la respuesta se sintiera natural ya pasó. Active Memory da al sistema una oportunidad acotada de mostrar memoria relevante antes de que se genere la respuesta principal.Documentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
Inicio rápido
Pega esto enopenclaw.json para una configuración con valores predeterminados seguros: Plugin activado, limitado al
agente main, solo sesiones de mensaje directo, hereda el modelo de la sesión
cuando está disponible:
plugins.entries.active-memory.enabled: trueactiva el Pluginconfig.agents: ["main"]habilita Active Memory solo para el agentemainconfig.allowedChatTypes: ["direct"]lo limita a sesiones de mensaje directo (habilita grupos/canales explícitamente)config.model(opcional) fija un modelo de recuperación dedicado; si no se define, hereda el modelo de la sesión actualconfig.modelFallbackse usa solo cuando no se resuelve ningún modelo explícito o heredadoconfig.promptStyle: "balanced"es el valor predeterminado para el modorecent- Active Memory se ejecuta de todos modos solo en sesiones de chat interactivas persistentes aptas
Recomendaciones de velocidad
La configuración más simple es dejarconfig.model sin definir y permitir que Active Memory use
el mismo modelo que ya usas para las respuestas normales. Ese es el valor predeterminado más seguro
porque sigue tus preferencias existentes de proveedor, autenticación y modelo.
Si quieres que Active Memory se sienta más rápido, usa un modelo de inferencia dedicado
en lugar de tomar prestado el modelo principal de chat. La calidad de la recuperación importa, pero la latencia
importa más que en la ruta de respuesta principal, y la superficie de herramientas de Active Memory
es estrecha (solo llama a las herramientas de recuperación de memoria disponibles).
Buenas opciones de modelos rápidos:
cerebras/gpt-oss-120bpara un modelo de recuperación dedicado de baja latenciagoogle/gemini-3-flashcomo alternativa de baja latencia sin cambiar tu modelo principal de chat- tu modelo normal de sesión, dejando
config.modelsin definir
Configuración de Cerebras
Agrega un proveedor de Cerebras y apunta Active Memory a él:chat/completions para el
modelo elegido; la visibilidad de /v1/models por sí sola no lo garantiza.
Cómo verlo
Active Memory inyecta un prefijo de prompt no confiable oculto para el modelo. No expone etiquetas<active_memory_plugin>...</active_memory_plugin> sin procesar en la
respuesta normal visible para el cliente.
Alternancia de sesión
Usa el comando del Plugin cuando quieras pausar o reanudar Active Memory para la sesión de chat actual sin editar la configuración:plugins.entries.active-memory.enabled, la selección de agentes ni otra
configuración global.
Si quieres que el comando escriba la configuración y pause o reanude Active Memory para
todas las sesiones, usa la forma global explícita:
plugins.entries.active-memory.config.enabled. Deja
plugins.entries.active-memory.enabled activado para que el comando siga disponible para
volver a activar Active Memory más tarde.
Si quieres ver qué está haciendo Active Memory en una sesión en vivo, activa las
alternancias de sesión que coincidan con la salida que quieres:
- una línea de estado de Active Memory como
Active Memory: status=ok elapsed=842ms query=recent summary=34 charscuando/verbose on - un resumen de depuración legible como
Active Memory Debug: Lemon pepper wings with blue cheese.cuando/trace on
/trace raw, el bloque trazado Model Input (User Role) mostrará
el prefijo oculto de Active Memory como:
Cuándo se ejecuta
Active Memory usa dos compuertas:- Habilitación por configuración
El Plugin debe estar habilitado, y el id del agente actual debe aparecer en
plugins.entries.active-memory.config.agents. - Aptitud estricta en tiempo de ejecución Incluso cuando está habilitado y dirigido al agente, Active Memory solo se ejecuta en sesiones de chat interactivas persistentes aptas.
Tipos de sesión
config.allowedChatTypes controla qué tipos de conversaciones pueden ejecutar Active
Memory en absoluto.
El valor predeterminado es:
config.allowedChatIds y
config.deniedChatIds después de elegir los tipos de sesión permitidos.
allowedChatIds es una lista de permitidos explícita de ids de conversación resueltos. Cuando
no está vacía, Active Memory solo se ejecuta cuando el id de conversación de la sesión está en
esa lista. Esto restringe todos los tipos de chat permitidos a la vez, incluidos los mensajes
directos. Si quieres todos los mensajes directos y solo grupos específicos, incluye
los ids de pares directos en allowedChatIds o mantén allowedChatTypes enfocado en
el despliegue de grupo/canal que estás probando.
deniedChatIds es una lista de denegados explícita. Siempre prevalece sobre
allowedChatTypes y allowedChatIds, por lo que una conversación coincidente se omite
aunque su tipo de sesión esté permitido por lo demás.
Los ids vienen de la clave de sesión persistente del canal: por ejemplo, chat_id /
open_id de Feishu, id de chat de Telegram o id de canal de Slack. La coincidencia no distingue
mayúsculas de minúsculas. Si allowedChatIds no está vacío y OpenClaw no puede resolver un
id de conversación para la sesión, Active Memory omite el turno en lugar de
adivinar.
Ejemplo:
Dónde se ejecuta
Active Memory es una función de enriquecimiento conversacional, no una función de inferencia para toda la plataforma.| Superficie | ¿Ejecuta Active Memory? |
|---|---|
| UI de control / sesiones persistentes de chat web | Sí, si el Plugin está habilitado y el agente está dirigido |
| Otras sesiones interactivas de canal en la misma ruta de chat persistente | Sí, si el Plugin está habilitado y el agente está dirigido |
| Ejecuciones sin interfaz de un solo uso | No |
| Ejecuciones de Heartbeat/en segundo plano | No |
Rutas internas genéricas de agent-command | No |
| Ejecución de subagente/ayudante interno | No |
Por qué usarlo
Usa Active Memory cuando:- la sesión es persistente y visible para el usuario
- el agente tiene memoria significativa a largo plazo para buscar
- la continuidad y la personalización importan más que el determinismo bruto del prompt
- preferencias estables
- hábitos recurrentes
- contexto de usuario a largo plazo que debería aparecer de forma natural
- automatización
- trabajadores internos
- tareas de API de un solo uso
- lugares donde la personalización oculta resultaría sorprendente
Cómo funciona
La forma en tiempo de ejecución es: El subagente de memoria bloqueante solo puede usar las herramientas de recuperación de memoria configuradas. De forma predeterminada son:memory_searchmemory_get
plugins.slots.memory es memory-lancedb, el valor predeterminado es memory_recall
en su lugar. Define config.toolsAllow cuando otro proveedor de memoria exponga un
contrato de herramienta de recuperación diferente.
Si la conexión es débil, debe devolver NONE.
Modos de consulta
config.queryMode controla cuánta conversación ve el subagente de memoria bloqueante.
Elige el modo más pequeño que todavía responda bien a preguntas de seguimiento;
los presupuestos de tiempo de espera deben crecer con el tamaño del contexto (message < recent < full).
- message
- recent
- full
Solo se envía el mensaje de usuario más reciente.Usa esto cuando:
- quieres el comportamiento más rápido
- quieres el sesgo más fuerte hacia la recuperación de preferencias estables
- los turnos de seguimiento no necesitan contexto conversacional
3000 a 5000 ms para config.timeoutMs.Estilos de prompt
config.promptStyle controla cuán dispuesto o estricto es el subagente de memoria bloqueante
al decidir si devolver memoria.
Estilos disponibles:
balanced: valor predeterminado de propósito general para el modorecentstrict: el menos dispuesto; ideal cuando quieres muy poca filtración del contexto cercanocontextual: el más favorable a la continuidad; ideal cuando el historial de conversación debe importar másrecall-heavy: más dispuesto a mostrar memoria ante coincidencias más suaves pero aún plausiblesprecision-heavy: prefiere agresivamenteNONEsalvo que la coincidencia sea evidentepreference-only: optimizado para favoritos, hábitos, rutinas, gustos y datos personales recurrentes
config.promptStyle no está establecido:
config.promptStyle explícitamente, esa anulación tiene prioridad.
Ejemplo:
Política de fallback del modelo
Siconfig.model no está establecido, Active Memory intenta resolver un modelo en este orden:
config.modelFallback controla el paso de fallback configurado.
Fallback personalizado opcional:
config.modelFallbackPolicy se conserva solo como un campo de compatibilidad
obsoleto para configuraciones antiguas. Ya no cambia el comportamiento en tiempo de ejecución.
Herramientas de memoria
De forma predeterminada, Active Memory permite que el subagente de recuperación bloqueante llame amemory_search y memory_get. Eso coincide con el contrato integrado de memory-core.
Cuando plugins.slots.memory selecciona memory-lancedb y
config.toolsAllow no está establecido, Active Memory conserva el comportamiento existente de LanceDB
y usa memory_recall en su lugar.
Si usas otro Plugin de memoria, establece config.toolsAllow con los nombres exactos de las herramientas
que registra ese Plugin. Active Memory lista esas herramientas en el prompt de recuperación
y pasa la misma lista al subagente integrado. Si ninguna de las
herramientas configuradas está disponible, o el subagente de memoria falla, Active Memory
omite la recuperación para ese turno y la respuesta principal continúa sin contexto de memoria.
toolsAllow solo acepta nombres concretos de herramientas de memoria. Los comodines, entradas
group:* y herramientas centrales del agente como read, exec, message y
web_search se ignoran antes de que se inicie el subagente de memoria oculto.
Nota sobre el comportamiento predeterminado: Active Memory ya no incluye memory_recall en la
lista de permitidos predeterminada de memory-core. Las configuraciones existentes de memory-lancedb siguen funcionando
cuando plugins.slots.memory está establecido en memory-lancedb. Un toolsAllow explícito
siempre anula el valor predeterminado automático.
memory-core integrado
La configuración predeterminada no necesita untoolsAllow explícito:
Memoria LanceDB
El Plugin incluidomemory-lancedb expone memory_recall. Seleccionar la
ranura de memoria basta para que Active Memory use esa herramienta de recuperación:
Lossless Claw
Lossless Claw es un Plugin de motor de contexto con sus propias herramientas de recuperación. Instálalo y configúralo primero como motor de contexto; consulta Motor de contexto. Luego permite que Active Memory use las herramientas de recuperación de Lossless Claw:lcm_expand en toolsAllow para el subagente principal de Active Memory.
Lossless Claw lo usa como una herramienta de expansión delegada de nivel inferior.
Vías de escape avanzadas
Estas opciones no forman parte intencionalmente de la configuración recomendada.config.thinking puede anular el nivel de razonamiento del subagente de memoria bloqueante:
config.promptAppend agrega instrucciones adicionales del operador después del prompt predeterminado de Active
Memory y antes del contexto de la conversación:
promptAppend con toolsAllow personalizado cuando un Plugin de memoria no central necesite
un orden de herramientas específico del proveedor o instrucciones para dar forma a las consultas.
config.promptOverride reemplaza el prompt predeterminado de Active Memory. OpenClaw
aún agrega el contexto de la conversación después:
NONE
o contexto compacto de datos de usuario para el modelo principal.
Persistencia de transcripciones
Las ejecuciones del subagente de memoria bloqueante de Active Memory crean una transcripción realsession.jsonl durante la llamada al subagente de memoria bloqueante.
De forma predeterminada, esa transcripción es temporal:
- se escribe en un directorio temporal
- se usa solo para la ejecución del subagente de memoria bloqueante
- se elimina inmediatamente después de que termina la ejecución
config.transcriptDir.
Usa esto con cuidado:
- las transcripciones del subagente de memoria bloqueante pueden acumularse rápidamente en sesiones con mucha actividad
- el modo de consulta
fullpuede duplicar gran parte del contexto de conversación - estas transcripciones contienen contexto de prompt oculto y memorias recuperadas
Configuración
Toda la configuración de Active Memory vive bajo:| Clave | Tipo | Significado |
|---|---|---|
enabled | boolean | Habilita el Plugin en sí |
config.agents | string[] | Identificadores de agente que pueden usar Active Memory |
config.model | string | Referencia opcional del modelo del subagente de memoria bloqueante; si no se define, Active Memory usa el modelo de la sesión actual |
config.allowedChatTypes | ("direct" | "group" | "channel")[] | Tipos de sesión que pueden ejecutar Active Memory; el valor predeterminado son las sesiones de estilo mensaje directo |
config.allowedChatIds | string[] | Lista opcional de permitidos por conversación aplicada después de allowedChatTypes; las listas no vacías fallan de forma cerrada |
config.deniedChatIds | string[] | Lista opcional de denegados por conversación que anula los tipos de sesión permitidos y los identificadores permitidos |
config.queryMode | "message" | "recent" | "full" | Controla cuánta conversación ve el subagente de memoria bloqueante |
config.promptStyle | "balanced" | "strict" | "contextual" | "recall-heavy" | "precision-heavy" | "preference-only" | Controla cuán dispuesto o estricto es el subagente de memoria bloqueante al decidir si devuelve memoria |
config.toolsAllow | string[] | Nombres concretos de herramientas de memoria que puede llamar el subagente de memoria bloqueante; el valor predeterminado es ["memory_search", "memory_get"], o ["memory_recall"] cuando plugins.slots.memory es memory-lancedb; los comodines, las entradas group:* y las herramientas principales del agente se ignoran |
config.thinking | "off" | "minimal" | "low" | "medium" | "high" | "xhigh" | "adaptive" | "max" | Anulación avanzada de razonamiento para el subagente de memoria bloqueante; valor predeterminado off para mayor velocidad |
config.promptOverride | string | Reemplazo avanzado completo del prompt; no se recomienda para uso normal |
config.promptAppend | string | Instrucciones adicionales avanzadas anexadas al prompt predeterminado o anulado |
config.timeoutMs | number | Tiempo de espera estricto para el subagente de memoria bloqueante, limitado a 120000 ms |
config.setupGraceTimeoutMs | number | Presupuesto adicional avanzado de configuración antes de que venza el tiempo de espera de recuperación; el valor predeterminado es 0 y está limitado a 30000 ms. Consulta Gracia de arranque en frío para obtener orientación de actualización de v2026.4.x |
config.maxSummaryChars | number | Máximo total de caracteres permitidos en el resumen de Active Memory |
config.logging | boolean | Emite registros de Active Memory durante el ajuste |
config.persistTranscripts | boolean | Conserva en disco las transcripciones del subagente de memoria bloqueante en lugar de eliminar archivos temporales |
config.transcriptDir | string | Directorio relativo de transcripciones del subagente de memoria bloqueante bajo la carpeta de sesiones del agente |
| Clave | Tipo | Significado |
|---|---|---|
config.maxSummaryChars | number | Máximo total de caracteres permitidos en el resumen de Active Memory |
config.recentUserTurns | number | Turnos previos del usuario que se incluirán cuando queryMode sea recent |
config.recentAssistantTurns | number | Turnos previos del asistente que se incluirán cuando queryMode sea recent |
config.recentUserChars | number | Máximo de caracteres por turno reciente del usuario |
config.recentAssistantChars | number | Máximo de caracteres por turno reciente del asistente |
config.cacheTtlMs | number | Reutilización de caché para consultas idénticas repetidas (rango: 1000-120000 ms; predeterminado: 15000) |
config.circuitBreakerMaxTimeouts | number | Omite la recuperación después de esta cantidad de tiempos de espera consecutivos para el mismo agente/modelo. Se restablece tras una recuperación correcta o después de que venza el período de enfriamiento (rango: 1-20; predeterminado: 3). |
config.circuitBreakerCooldownMs | number | Cuánto tiempo omitir la recuperación después de que se active el disyuntor, en ms (rango: 5000-600000; predeterminado: 60000). |
Configuración recomendada
Empieza conrecent.
/verbose on para la
línea de estado normal y /trace on para el resumen de depuración de Active Memory en lugar
de buscar un comando de depuración separado de Active Memory. En los canales de chat, esas
líneas de diagnóstico se envían después de la respuesta principal del asistente, no antes.
Luego cambia a:
messagesi quieres menor latenciafullsi decides que el contexto adicional merece un subagente de memoria bloqueante más lento
Gracia de arranque en frío
Antes de v2026.5.2, el Plugin extendía silenciosamente tutimeoutMs configurado en
30000 ms adicionales durante el arranque en frío para que el calentamiento del modelo, la carga
del índice de incrustaciones y la primera recuperación pudieran compartir un presupuesto mayor.
v2026.5.2 trasladó esa gracia detrás de una configuración explícita setupGraceTimeoutMs: tu
timeoutMs configurado ahora es el presupuesto predeterminado, salvo que optes por habilitarlo.
Si actualizaste desde v2026.4.x y estableciste timeoutMs en un valor ajustado para el
mundo anterior de gracia implícita (el timeoutMs: 15000 inicial recomendado es un
ejemplo), establece setupGraceTimeoutMs: 30000 para extender el hook de construcción de prompt y
los presupuestos del watchdog externo de nuevo a los valores efectivos previos a v5.2:
setupGraceTimeoutMs, para que el Plugin ya no extienda silenciosamente
las configuraciones de 15000 ms a 45000 ms en el carril principal.”
El ejecutor de recuperación integrado usa el mismo presupuesto de tiempo de espera efectivo, por lo que
setupGraceTimeoutMs cubre tanto el watchdog externo de construcción del prompt como la ejecución interna
bloqueante de recuperación.
Para gateways con recursos ajustados donde la latencia de arranque en frío es una compensación conocida,
también funcionan valores más bajos (5000–15000 ms); la compensación es una mayor probabilidad de que
la primera recuperación tras reiniciar un gateway devuelva vacío mientras finaliza el calentamiento.
Depuración
Si Active Memory no aparece donde esperas:- Confirma que el plugin esté habilitado en
plugins.entries.active-memory.enabled. - Confirma que el id del agente actual figure en
config.agents. - Confirma que estás probando mediante una sesión de chat persistente interactiva.
- Activa
config.logging: truey observa los registros del gateway. - Verifica que la búsqueda de memoria funcione con
openclaw memory status --deep.
maxSummaryChars
- reduce
queryMode - reduce
timeoutMs - reduce los recuentos de turnos recientes
- reduce los límites de caracteres por turno
Problemas comunes
Active Memory se apoya en la canalización de recuperación del plugin de memoria configurado, por lo que la mayoría de las sorpresas de recuperación son problemas del proveedor de embeddings, no errores de Active Memory. La ruta predeterminadamemory-core usa memory_search y memory_get; el espacio
memory-lancedb usa memory_recall. Si usas otro plugin de memoria,
confirma que config.toolsAllow nombre las herramientas que ese plugin registra realmente.
Embedding provider switched or stopped working
Embedding provider switched or stopped working
Si
memorySearch.provider no está configurado, OpenClaw detecta automáticamente el primer
proveedor de embeddings disponible. Una nueva clave de API, el agotamiento de cuota o un
proveedor alojado limitado por tasa pueden cambiar qué proveedor se resuelve entre
ejecuciones. Si no se resuelve ningún proveedor, memory_search puede degradarse a una
recuperación solo léxica; los fallos en tiempo de ejecución después de que ya se haya
seleccionado un proveedor no recurren automáticamente a una alternativa.Fija el proveedor (y una alternativa opcional) explícitamente para que la selección sea
determinista. Consulta Búsqueda de memoria para ver la lista
completa de proveedores y ejemplos de fijación.Recall feels slow, empty, or inconsistent
Recall feels slow, empty, or inconsistent
- Activa
/trace onpara mostrar el resumen de depuración de Active Memory propiedad del plugin en la sesión. - Activa
/verbose onpara ver también la línea de estado🧩 Active Memory: ...después de cada respuesta. - Observa los registros del gateway para
active-memory: ... start|done,memory sync failed (search-bootstrap)o errores de embeddings del proveedor. - Ejecuta
openclaw memory status --deeppara inspeccionar el backend de búsqueda de memoria y el estado del índice. - Si usas
ollama, confirma que el modelo de embeddings esté instalado (ollama list).
First recall after gateway restart returns `status=timeout`
First recall after gateway restart returns `status=timeout`
En v2026.5.2 y versiones posteriores, si la preparación de arranque en frío (calentamiento del modelo + carga
del índice de embeddings) no ha terminado cuando se dispara la primera recuperación, la ejecución
puede alcanzar el presupuesto
timeoutMs configurado y devolver status=timeout
con salida vacía. Los registros del Gateway muestran active-memory timeout after Nms
alrededor de la primera respuesta apta después de un reinicio.Consulta Gracia de arranque en frío en la configuración recomendada para ver el
valor setupGraceTimeoutMs recomendado.