Active Memory est un sous-agent de mémoire bloquant facultatif, géré par un plugin, qui s’exécute avant la réponse principale pour les sessions conversationnelles éligibles. Il existe parce que la plupart des systèmes de mémoire sont capables mais réactifs. Ils s’appuient sur l’agent principal pour décider quand chercher dans la mémoire, ou sur l’utilisateur pour dire des choses comme “remember this” ou “search memory.” À ce stade, le moment où la mémoire aurait rendu la réponse naturelle est déjà passé. Active Memory donne au système une occasion bornée de faire remonter la mémoire pertinente avant la génération de la réponse principale.Documentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
Démarrage rapide
Collez ceci dansopenclaw.json pour une configuration aux valeurs par défaut sûres — plugin activé, limité à
l’agent main, sessions en message direct uniquement, hérite du modèle de session
lorsqu’il est disponible :
plugins.entries.active-memory.enabled: trueactive le pluginconfig.agents: ["main"]inscrit uniquement l’agentmainà Active Memoryconfig.allowedChatTypes: ["direct"]le limite aux sessions en message direct (activez explicitement les groupes/canaux)config.model(facultatif) fixe un modèle de rappel dédié ; non défini, il hérite du modèle de session actuelconfig.modelFallbackest utilisé uniquement lorsqu’aucun modèle explicite ou hérité n’est résoluconfig.promptStyle: "balanced"est la valeur par défaut du moderecent- Active Memory s’exécute toujours uniquement pour les sessions de chat persistantes interactives éligibles
Recommandations de vitesse
La configuration la plus simple consiste à laisserconfig.model non défini et à laisser Active Memory utiliser
le même modèle que celui déjà utilisé pour les réponses normales. C’est la valeur par défaut la plus sûre,
car elle suit vos préférences existantes de fournisseur, d’authentification et de modèle.
Si vous voulez qu’Active Memory paraisse plus rapide, utilisez un modèle d’inférence dédié
au lieu d’emprunter le modèle de chat principal. La qualité du rappel compte, mais la latence
compte davantage que pour le chemin de réponse principal, et la surface d’outils d’Active Memory
est étroite (elle appelle uniquement les outils de rappel mémoire disponibles).
Bonnes options de modèles rapides :
cerebras/gpt-oss-120bpour un modèle de rappel dédié à faible latencegoogle/gemini-3-flashcomme solution de secours à faible latence sans changer votre modèle de chat principal- votre modèle de session normal, en laissant
config.modelnon défini
Configuration de Cerebras
Ajoutez un fournisseur Cerebras et pointez Active Memory dessus :chat/completions pour le
modèle choisi — la visibilité dans /v1/models seule ne le garantit pas.
Comment le voir
Active Memory injecte un préfixe de prompt masqué et non fiable pour le modèle. Il n’expose pas les balises brutes<active_memory_plugin>...</active_memory_plugin> dans la
réponse normale visible par le client.
Bascule de session
Utilisez la commande du plugin lorsque vous voulez suspendre ou reprendre Active Memory pour la session de chat actuelle sans modifier la configuration :plugins.entries.active-memory.enabled, le ciblage des agents ni les autres
paramètres globaux.
Si vous voulez que la commande écrive la configuration et suspende ou reprenne Active Memory pour
toutes les sessions, utilisez la forme globale explicite :
plugins.entries.active-memory.config.enabled. Elle laisse
plugins.entries.active-memory.enabled activé afin que la commande reste disponible pour
réactiver Active Memory plus tard.
Si vous voulez voir ce que fait Active Memory dans une session en direct, activez les
bascules de session correspondant à la sortie souhaitée :
- une ligne d’état Active Memory telle que
Active Memory: status=ok elapsed=842ms query=recent summary=34 charslorsque/verbose on - un résumé de débogage lisible tel que
Active Memory Debug: Lemon pepper wings with blue cheese.lorsque/trace on
/trace raw, le bloc tracé Model Input (User Role) affichera
le préfixe Active Memory masqué ainsi :
Quand il s’exécute
Active Memory utilise deux garde-fous :- Activation par configuration
Le plugin doit être activé, et l’identifiant de l’agent actuel doit apparaître dans
plugins.entries.active-memory.config.agents. - Éligibilité stricte à l’exécution Même lorsqu’il est activé et ciblé, Active Memory s’exécute uniquement pour les sessions de chat persistantes interactives éligibles.
Types de sessions
config.allowedChatTypes contrôle les types de conversations dans lesquels Active
Memory peut s’exécuter.
La valeur par défaut est :
config.allowedChatIds et
config.deniedChatIds après avoir choisi les types de sessions autorisés.
allowedChatIds est une liste d’autorisation explicite d’identifiants de conversation résolus. Lorsqu’elle
n’est pas vide, Active Memory s’exécute uniquement lorsque l’identifiant de conversation de la session figure dans
cette liste. Cela restreint tous les types de chat autorisés à la fois, y compris les messages directs.
Si vous voulez tous les messages directs plus seulement certains groupes, incluez
les identifiants des pairs directs dans allowedChatIds ou gardez allowedChatTypes centré sur
le déploiement groupe/canal que vous testez.
deniedChatIds est une liste de refus explicite. Elle l’emporte toujours sur
allowedChatTypes et allowedChatIds, de sorte qu’une conversation correspondante est ignorée
même si son type de session est par ailleurs autorisé.
Les identifiants proviennent de la clé de session persistante du canal : par exemple
chat_id / open_id Feishu, l’identifiant de chat Telegram ou l’identifiant de canal Slack. La correspondance est
insensible à la casse. Si allowedChatIds n’est pas vide et qu’OpenClaw ne peut pas résoudre un
identifiant de conversation pour la session, Active Memory ignore le tour au lieu de
deviner.
Exemple :
Où il s’exécute
Active Memory est une fonctionnalité d’enrichissement conversationnel, pas une fonctionnalité d’inférence à l’échelle de la plateforme.| Surface | Active Memory s’exécute ? |
|---|---|
| Sessions persistantes de l’interface de contrôle / chat web | Oui, si le plugin est activé et que l’agent est ciblé |
| Autres sessions de canal interactives sur le même chemin de chat persistant | Oui, si le plugin est activé et que l’agent est ciblé |
| Exécutions ponctuelles sans interface | Non |
| Exécutions Heartbeat/en arrière-plan | Non |
Chemins internes génériques agent-command | Non |
| Exécution de sous-agent/assistant interne | Non |
Pourquoi l’utiliser
Utilisez Active Memory lorsque :- la session est persistante et destinée à l’utilisateur
- l’agent dispose d’une mémoire à long terme significative à interroger
- la continuité et la personnalisation comptent plus que le déterminisme brut du prompt
- les préférences stables
- les habitudes récurrentes
- le contexte utilisateur à long terme qui doit émerger naturellement
- l’automatisation
- les workers internes
- les tâches API ponctuelles
- les endroits où une personnalisation masquée serait surprenante
Fonctionnement
La forme d’exécution est : Le sous-agent de mémoire bloquant ne peut utiliser que les outils de rappel mémoire configurés. Par défaut, il s’agit de :memory_searchmemory_get
plugins.slots.memory vaut memory-lancedb, la valeur par défaut est memory_recall
à la place. Définissez config.toolsAllow lorsqu’un autre fournisseur de mémoire expose un
contrat d’outil de rappel différent.
Si la connexion est faible, il doit renvoyer NONE.
Modes de requête
config.queryMode contrôle la quantité de conversation vue par le sous-agent de mémoire bloquant.
Choisissez le plus petit mode qui répond encore correctement aux questions de suivi ;
les budgets de délai d’attente doivent croître avec la taille du contexte (message < recent < full).
- message
- recent
- full
Seul le dernier message utilisateur est envoyé.Utilisez ceci lorsque :
- vous voulez le comportement le plus rapide
- vous voulez le biais le plus fort vers le rappel des préférences stables
- les tours de suivi n’ont pas besoin du contexte conversationnel
3000 à 5000 ms pour config.timeoutMs.Styles de prompt
config.promptStyle contrôle dans quelle mesure le sous-agent de mémoire bloquant est empressé ou strict
lorsqu’il décide s’il doit renvoyer de la mémoire.
Styles disponibles :
balanced: valeur par défaut polyvalente pour le moderecentstrict: le moins empressé ; idéal lorsque vous voulez très peu d’interférence du contexte prochecontextual: le plus favorable à la continuité ; idéal lorsque l’historique de conversation doit compter davantagerecall-heavy: plus enclin à faire remonter la mémoire sur des correspondances plus souples, mais toujours plausiblesprecision-heavy: privilégie fortementNONEsauf si la correspondance est évidentepreference-only: optimisé pour les favoris, habitudes, routines, goûts et faits personnels récurrents
config.promptStyle n’est pas défini :
config.promptStyle, ce remplacement prévaut.
Exemple :
Politique de repli du modèle
Siconfig.model n’est pas défini, Active Memory tente de résoudre un modèle dans cet ordre :
config.modelFallback contrôle l’étape de repli configurée.
Repli personnalisé facultatif :
config.modelFallbackPolicy est conservé uniquement comme champ de compatibilité
obsolète pour les anciennes configurations. Il ne modifie plus le comportement à l’exécution.
Outils de mémoire
Par défaut, Active Memory permet au sous-agent de rappel bloquant d’appelermemory_search et memory_get. Cela correspond au contrat intégré de memory-core.
Lorsque plugins.slots.memory sélectionne memory-lancedb et que
config.toolsAllow n’est pas défini, Active Memory conserve le comportement LanceDB existant
et utilise plutôt memory_recall.
Si vous utilisez un autre Plugin de mémoire, définissez config.toolsAllow sur les noms exacts
des outils que ce Plugin enregistre. Active Memory liste ces outils dans le prompt de rappel
et transmet la même liste au sous-agent intégré. Si aucun des outils configurés
n’est disponible, ou si le sous-agent de mémoire échoue, Active Memory
ignore le rappel pour ce tour et la réponse principale continue sans contexte de mémoire.
toolsAllow accepte uniquement des noms concrets d’outils de mémoire. Les jokers, les entrées
group:* et les outils d’agent principaux comme read, exec, message et
web_search sont ignorés avant le démarrage du sous-agent de mémoire masqué.
Note sur le comportement par défaut : Active Memory n’inclut plus memory_recall dans la
liste d’autorisation par défaut de memory-core. Les configurations memory-lancedb existantes continuent de fonctionner
lorsque plugins.slots.memory est défini sur memory-lancedb. Un toolsAllow explicite
remplace toujours la valeur automatique par défaut.
memory-core intégré
La configuration par défaut ne nécessite pas detoolsAllow explicite :
Mémoire LanceDB
Le Pluginmemory-lancedb groupé expose memory_recall. La sélection du
slot de mémoire suffit pour qu’Active Memory utilise cet outil de rappel :
Lossless Claw
Lossless Claw est un Plugin de moteur de contexte avec ses propres outils de rappel. Installez-le et configurez-le d’abord comme moteur de contexte ; consultez Moteur de contexte. Autorisez ensuite Active Memory à utiliser les outils de rappel de Lossless Claw :lcm_expand dans toolsAllow pour le sous-agent principal d’Active Memory.
Lossless Claw l’utilise comme outil d’expansion délégué de plus bas niveau.
Options avancées de contournement
Ces options ne font volontairement pas partie de la configuration recommandée.config.thinking peut remplacer le niveau de raisonnement du sous-agent de mémoire bloquant :
config.promptAppend ajoute des instructions opérateur supplémentaires après le prompt Active
Memory par défaut et avant le contexte de conversation :
promptAppend avec un toolsAllow personnalisé lorsqu’un Plugin de mémoire non principal a besoin
d’un ordre d’outils propre au fournisseur ou d’instructions de formulation des requêtes.
config.promptOverride remplace le prompt Active Memory par défaut. OpenClaw
ajoute toujours ensuite le contexte de conversation :
NONE,
soit un contexte compact de faits utilisateur pour le modèle principal.
Persistance des transcriptions
Les exécutions du sous-agent de mémoire bloquant d’Active Memory créent une véritable transcriptionsession.jsonl pendant l’appel au sous-agent de mémoire bloquant.
Par défaut, cette transcription est temporaire :
- elle est écrite dans un répertoire temporaire
- elle est utilisée uniquement pour l’exécution du sous-agent de mémoire bloquant
- elle est supprimée immédiatement après la fin de l’exécution
config.transcriptDir.
Utilisez ceci avec précaution :
- les transcriptions du sous-agent de mémoire bloquant peuvent s’accumuler rapidement sur les sessions actives
- le mode de requête
fullpeut dupliquer beaucoup de contexte de conversation - ces transcriptions contiennent du contexte de prompt masqué et des souvenirs rappelés
Configuration
Toute la configuration d’Active Memory se trouve sous :| Key | Type | Signification |
|---|---|---|
enabled | boolean | Active le plugin lui-même |
config.agents | string[] | Identifiants d’agent qui peuvent utiliser la mémoire active |
config.model | string | Référence facultative du modèle du sous-agent de mémoire bloquant ; lorsqu’elle n’est pas définie, la mémoire active utilise le modèle de la session actuelle |
config.allowedChatTypes | ("direct" | "group" | "channel")[] | Types de session qui peuvent exécuter Active Memory ; par défaut, sessions de type message direct |
config.allowedChatIds | string[] | Liste d’autorisation facultative par conversation appliquée après allowedChatTypes ; les listes non vides échouent en mode fermé |
config.deniedChatIds | string[] | Liste de refus facultative par conversation qui remplace les types de session autorisés et les identifiants autorisés |
config.queryMode | "message" | "recent" | "full" | Contrôle la quantité de conversation que voit le sous-agent de mémoire bloquant |
config.promptStyle | "balanced" | "strict" | "contextual" | "recall-heavy" | "precision-heavy" | "preference-only" | Contrôle le degré d’empressement ou de rigueur du sous-agent de mémoire bloquant lorsqu’il décide s’il doit renvoyer de la mémoire |
config.toolsAllow | string[] | Noms concrets des outils de mémoire que le sous-agent de mémoire bloquant peut appeler ; par défaut ["memory_search", "memory_get"], ou ["memory_recall"] lorsque plugins.slots.memory vaut memory-lancedb ; les caractères génériques, les entrées group:* et les outils d’agent principaux sont ignorés |
config.thinking | "off" | "minimal" | "low" | "medium" | "high" | "xhigh" | "adaptive" | "max" | Remplacement avancé de la réflexion pour le sous-agent de mémoire bloquant ; valeur par défaut off pour la rapidité |
config.promptOverride | string | Remplacement avancé complet du prompt ; non recommandé pour une utilisation normale |
config.promptAppend | string | Instructions supplémentaires avancées ajoutées au prompt par défaut ou remplacé |
config.timeoutMs | number | Délai d’expiration strict pour le sous-agent de mémoire bloquant, plafonné à 120000 ms |
config.setupGraceTimeoutMs | number | Budget de configuration supplémentaire avancé avant l’expiration du délai de rappel ; par défaut 0 et plafonné à 30000 ms. Consultez Délai de grâce au démarrage à froid pour les conseils de mise à niveau vers v2026.4.x |
config.maxSummaryChars | number | Nombre total maximal de caractères autorisés dans le résumé de la mémoire active |
config.logging | boolean | Émet des journaux de mémoire active pendant le réglage |
config.persistTranscripts | boolean | Conserve les transcriptions du sous-agent de mémoire bloquant sur le disque au lieu de supprimer les fichiers temporaires |
config.transcriptDir | string | Répertoire relatif des transcriptions du sous-agent de mémoire bloquant sous le dossier des sessions d’agent |
| Key | Type | Signification |
|---|---|---|
config.maxSummaryChars | number | Nombre total maximal de caractères autorisés dans le résumé de la mémoire active |
config.recentUserTurns | number | Tours utilisateur précédents à inclure lorsque queryMode vaut recent |
config.recentAssistantTurns | number | Tours assistant précédents à inclure lorsque queryMode vaut recent |
config.recentUserChars | number | Nombre maximal de caractères par tour utilisateur récent |
config.recentAssistantChars | number | Nombre maximal de caractères par tour assistant récent |
config.cacheTtlMs | number | Réutilisation du cache pour les requêtes identiques répétées (plage : 1000-120000 ms ; valeur par défaut : 15000) |
config.circuitBreakerMaxTimeouts | number | Ignore le rappel après ce nombre de délais d’expiration consécutifs pour le même agent/modèle. Se réinitialise après un rappel réussi ou après l’expiration du délai de récupération (plage : 1-20 ; valeur par défaut : 3). |
config.circuitBreakerCooldownMs | number | Durée pendant laquelle ignorer le rappel après le déclenchement du disjoncteur, en ms (plage : 5000-600000 ; valeur par défaut : 60000). |
Configuration recommandée
Commencez avecrecent.
/verbose on pour la
ligne d’état normale et /trace on pour le résumé de débogage d’active-memory au lieu
de chercher une commande de débogage active-memory distincte. Dans les canaux de discussion, ces
lignes de diagnostic sont envoyées après la réponse principale de l’assistant plutôt qu’avant.
Passez ensuite à :
messagesi vous voulez une latence plus faiblefullsi vous décidez que le contexte supplémentaire vaut le sous-agent de mémoire bloquant plus lent
Délai de grâce au démarrage à froid
Avant v2026.5.2, le plugin prolongeait silencieusement votretimeoutMs configuré de
30000 ms supplémentaires lors du démarrage à froid afin que le préchauffage du modèle, le chargement de l’index d’embeddings et
le premier rappel puissent partager un budget plus large. v2026.5.2 a déplacé ce délai de grâce
derrière une configuration explicite setupGraceTimeoutMs — votre timeoutMs configuré
est désormais le budget par défaut, sauf si vous l’activez explicitement.
Si vous avez effectué une mise à niveau depuis v2026.4.x et que vous avez défini timeoutMs sur une valeur réglée pour
l’ancien monde avec délai de grâce implicite (le timeoutMs: 15000 de démarrage recommandé en est un
exemple), définissez setupGraceTimeoutMs: 30000 pour étendre le hook de construction de prompt et
les budgets du watchdog externe afin de retrouver les valeurs effectives antérieures à v5.2 :
setupGraceTimeoutMs, afin que le plugin ne prolonge plus silencieusement
les configurations de 15000 ms à 45000 ms sur la voie principale. »
L’exécuteur de rappel intégré utilise le même budget effectif de délai d’expiration, donc
setupGraceTimeoutMs couvre à la fois le chien de garde externe de construction du prompt et l’exécution
bloquante interne du rappel.
Pour les Gateway aux ressources limitées où la latence de démarrage à froid est un compromis connu,
des valeurs plus basses (5000–15000 ms) fonctionnent aussi — le compromis est une probabilité plus élevée
que le tout premier rappel après un redémarrage du Gateway renvoie un résultat vide pendant que le préchauffage
se termine.
Débogage
Si Active Memory ne s’affiche pas là où vous l’attendez :- Vérifiez que le Plugin est activé sous
plugins.entries.active-memory.enabled. - Vérifiez que l’identifiant de l’agent actuel est listé dans
config.agents. - Vérifiez que vous testez via une session de chat persistante interactive.
- Activez
config.logging: trueet surveillez les journaux du Gateway. - Vérifiez que la recherche mémoire elle-même fonctionne avec
openclaw memory status --deep.
maxSummaryChars
- baissez
queryMode - baissez
timeoutMs - réduisez le nombre de tours récents
- réduisez les limites de caractères par tour
Problèmes courants
Active Memory repose sur le pipeline de rappel du plugin de mémoire configuré ; la plupart des surprises de rappel sont donc des problèmes de fournisseur d’embeddings, pas des bugs d’Active Memory. Le cheminmemory-core par défaut utilise memory_search et
memory_get ; l’emplacement memory-lancedb utilise memory_recall. Si vous utilisez
un autre plugin de mémoire, vérifiez que config.toolsAllow nomme les outils que ce
plugin enregistre réellement.
Le fournisseur d’embeddings a changé ou a cessé de fonctionner
Le fournisseur d’embeddings a changé ou a cessé de fonctionner
Si
memorySearch.provider n’est pas défini, OpenClaw détecte automatiquement le
premier fournisseur d’embeddings disponible. Une nouvelle clé API, l’épuisement
du quota ou un fournisseur hébergé limité par débit peuvent changer le fournisseur
résolu d’une exécution à l’autre. Si aucun fournisseur n’est résolu, memory_search
peut se dégrader en récupération lexicale uniquement ; les échecs d’exécution après
qu’un fournisseur a déjà été sélectionné ne basculent pas automatiquement vers un autre.Épinglez explicitement le fournisseur (et éventuellement un fournisseur de secours)
pour rendre la sélection déterministe. Consultez Recherche mémoire
pour la liste complète des fournisseurs et des exemples d’épinglage.Le rappel semble lent, vide ou incohérent
Le rappel semble lent, vide ou incohérent
- Activez
/trace onpour afficher dans la session le résumé de débogage Active Memory détenu par le plugin. - Activez
/verbose onpour voir également la ligne d’état🧩 Active Memory: ...après chaque réponse. - Surveillez les journaux du Gateway pour
active-memory: ... start|done,memory sync failed (search-bootstrap)ou les erreurs d’embeddings du fournisseur. - Exécutez
openclaw memory status --deeppour inspecter le backend de recherche mémoire et l’état de l’index. - Si vous utilisez
ollama, vérifiez que le modèle d’embeddings est installé (ollama list).
Le premier rappel après un redémarrage du Gateway renvoie `status=timeout`
Le premier rappel après un redémarrage du Gateway renvoie `status=timeout`
Sur v2026.5.2 et les versions ultérieures, si la configuration de démarrage à froid
(préchauffage du modèle + chargement de l’index d’embeddings) n’est pas terminée
au moment où le premier rappel se déclenche, l’exécution peut atteindre le budget
timeoutMs configuré et renvoyer status=timeout avec une sortie vide. Les journaux
du Gateway affichent active-memory timeout after Nms autour de la première réponse
éligible après un redémarrage.Consultez Grâce au démarrage à froid dans la configuration
recommandée pour la valeur setupGraceTimeoutMs recommandée.