Active memory — це необов’язковий blocking memory sub-agent, яким володіє Plugin і який запускається перед основною відповіддю для придатних розмовних сесій. Він існує тому, що більшість систем пам’яті здатні, але реактивні. Вони покладаються на основного агента, який вирішує, коли шукати в пам’яті, або на користувача, який каже щось на кшталт “remember this” чи “search memory.” На той момент мить, коли пам’ять могла б зробити відповідь природною, вже минула. Active memory дає системі одну обмежену можливість показати релевантну пам’ять до того, як буде згенеровано основну відповідь.Documentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
Швидкий старт
Вставте це вopenclaw.json для налаштування з безпечними типовими значеннями — Plugin увімкнено, обмежено
агентом main, лише сесії прямих повідомлень, успадковує модель сесії
за наявності:
plugins.entries.active-memory.enabled: trueвмикає Pluginconfig.agents: ["main"]підключає до active memory лише агентаmainconfig.allowedChatTypes: ["direct"]обмежує це сесіями прямих повідомлень (групи/канали підключайте явно)config.model(необов’язково) закріплює окрему модель пригадування; якщо не задано, успадковує поточну модель сесіїconfig.modelFallbackвикористовується лише тоді, коли не вдається визначити явно задану або успадковану модельconfig.promptStyle: "balanced"є типовим значенням для режимуrecent- Active memory все одно запускається лише для придатних інтерактивних постійних чат-сесій
Рекомендації щодо швидкодії
Найпростіше налаштування — залишитиconfig.model незаданим і дозволити Active Memory використовувати
ту саму модель, яку ви вже використовуєте для звичайних відповідей. Це найбезпечніший типовий варіант,
бо він дотримується ваших наявних налаштувань провайдера, автентифікації та моделі.
Якщо ви хочете, щоб Active Memory відчувалася швидшою, використовуйте окрему inference model
замість запозичення основної чат-моделі. Якість пригадування важлива, але затримка
важливіша, ніж для основного шляху відповіді, а поверхня інструментів Active Memory
вузька (вона викликає лише доступні інструменти пригадування пам’яті).
Добрі варіанти швидких моделей:
cerebras/gpt-oss-120bдля окремої низьколатентної моделі пригадуванняgoogle/gemini-3-flashяк низьколатентний fallback без зміни вашої основної чат-моделі- ваша звичайна модель сесії, якщо залишити
config.modelнезаданим
Налаштування Cerebras
Додайте провайдера Cerebras і спрямуйте на нього Active Memory:chat/completions для
вибраної моделі — сама лише видимість у /v1/models цього не гарантує.
Як це побачити
Active memory додає для моделі прихований недовірений префікс prompt. Вона не показує сирі теги<active_memory_plugin>...</active_memory_plugin> у
звичайній відповіді, видимій клієнту.
Перемикач сесії
Використовуйте команду Plugin, коли хочете призупинити або відновити active memory для поточної чат-сесії без редагування конфігурації:plugins.entries.active-memory.enabled, націлювання агентів чи іншу глобальну
конфігурацію.
Якщо ви хочете, щоб команда записала конфігурацію та призупинила або відновила active memory для
всіх сесій, використовуйте явну глобальну форму:
plugins.entries.active-memory.config.enabled. Вона залишає
plugins.entries.active-memory.enabled увімкненим, щоб команда залишалася доступною для
повторного ввімкнення active memory пізніше.
Якщо ви хочете бачити, що робить active memory у live-сесії, увімкніть
перемикачі сесії, які відповідають потрібному виводу:
- рядок стану active memory, наприклад
Active Memory: status=ok elapsed=842ms query=recent summary=34 chars, коли/verbose on - читабельний debug summary, наприклад
Active Memory Debug: Lemon pepper wings with blue cheese., коли/trace on
/trace raw, трасований блок Model Input (User Role) покаже
прихований префікс Active Memory як:
Коли це запускається
Active memory використовує два шлюзи:- Явне ввімкнення в конфігурації
Plugin має бути ввімкнено, а id поточного агента має бути в
plugins.entries.active-memory.config.agents. - Сувора runtime-придатність Навіть коли active memory увімкнено й націлено, вона запускається лише для придатних інтерактивних постійних чат-сесій.
Типи сесій
config.allowedChatTypes керує тим, у яких видах розмов узагалі може запускатися Active
Memory.
Типове значення:
config.allowedChatIds і
config.deniedChatIds після вибору дозволених типів сесій.
allowedChatIds — це явний allowlist визначених id розмов. Коли він
непорожній, Active Memory запускається лише тоді, коли id розмови сесії є в
цьому списку. Це звужує всі дозволені типи чатів одночасно, включно з прямими
повідомленнями. Якщо ви хочете всі прямі повідомлення плюс лише конкретні групи, додайте
id прямих співрозмовників до allowedChatIds або залиште allowedChatTypes зосередженим на
rollout груп/каналів, який ви тестуєте.
deniedChatIds — це явний denylist. Він завжди має пріоритет над
allowedChatTypes і allowedChatIds, тому відповідна розмова пропускається
навіть тоді, коли її тип сесії інакше дозволений.
Id походять із постійного ключа сесії каналу: наприклад Feishu
chat_id / open_id, Telegram chat id або Slack channel id. Зіставлення
нечутливе до регістру. Якщо allowedChatIds непорожній, а OpenClaw не може визначити
id розмови для сесії, Active Memory пропускає хід замість того, щоб
здогадуватися.
Приклад:
Де це запускається
Active memory — це функція збагачення розмов, а не загальноплатформна функція inference.| Поверхня | Запускає active memory? |
|---|---|
| Постійні сесії Control UI / web chat | Так, якщо Plugin увімкнено й агент націлено |
| Інші інтерактивні канальні сесії на тому самому постійному чат-шляху | Так, якщо Plugin увімкнено й агент націлено |
| Headless одноразові запуски | Ні |
| Heartbeat/background runs | Ні |
Загальні внутрішні шляхи agent-command | Ні |
| Виконання sub-agent/internal helper | Ні |
Навіщо це використовувати
Використовуйте active memory, коли:- сесія постійна й орієнтована на користувача
- агент має змістовну довгострокову пам’ять для пошуку
- безперервність і персоналізація важливіші за сиру детермінованість prompt
- стабільних уподобань
- повторюваних звичок
- довгострокового контексту користувача, який має з’являтися природно
- автоматизації
- внутрішніх worker
- одноразових API-завдань
- місць, де прихована персоналізація була б несподіваною
Як це працює
Runtime-форма така: Blocking memory sub-agent може використовувати лише налаштовані інструменти пригадування пам’яті. За замовчуванням це:memory_searchmemory_get
plugins.slots.memory має значення memory-lancedb, натомість типовим є memory_recall.
Задайте config.toolsAllow, коли інший провайдер пам’яті надає
інший контракт інструмента пригадування.
Якщо зв’язок слабкий, він має повернути NONE.
Режими запиту
config.queryMode керує тим, скільки розмови бачить blocking memory sub-agent.
Виберіть найменший режим, який усе ще добре відповідає на follow-up questions;
бюджети timeout мають зростати разом із розміром контексту (message < recent < full).
- message
- recent
- full
Надсилається лише останнє повідомлення користувача.Використовуйте це, коли:
- вам потрібна найшвидша поведінка
- вам потрібне найсильніше зміщення в бік пригадування стабільних уподобань
- follow-up turns не потребують розмовного контексту
3000 до 5000 ms для config.timeoutMs.Стилі prompt
config.promptStyle керує тим, наскільки охочим або суворим є блокувальний під-агент пам’яті
під час ухвалення рішення, чи повертати пам’ять.
Доступні стилі:
balanced: універсальний стандартний варіант для режимуrecentstrict: найменш охочий; найкраще підходить, коли потрібно мінімізувати просочування з найближчого контекстуcontextual: найсприятливіший до безперервності; найкраще підходить, коли історія розмови має більше значенняrecall-heavy: охочіше показує пам’ять за м’якшими, але все ще правдоподібними збігамиprecision-heavy: агресивно віддає перевагуNONE, якщо збіг не є очевиднимpreference-only: оптимізовано для улюбленого, звичок, рутин, смаків і повторюваних особистих фактів
config.promptStyle не задано:
config.promptStyle, це перевизначення матиме пріоритет.
Приклад:
Політика резервної моделі
Якщоconfig.model не задано, Active Memory намагається визначити модель у такому порядку:
config.modelFallback керує кроком налаштованої резервної моделі.
Необов’язкова власна резервна модель:
config.modelFallbackPolicy збережено лише як застаріле поле сумісності
для старіших конфігурацій. Воно більше не змінює поведінку під час виконання.
Інструменти пам’яті
За замовчуванням Active Memory дозволяє блокувальному під-агенту пригадування викликатиmemory_search і memory_get. Це відповідає вбудованому контракту memory-core.
Коли plugins.slots.memory вибирає memory-lancedb, а
config.toolsAllow не задано, Active Memory зберігає наявну поведінку LanceDB
і натомість використовує memory_recall.
Якщо ви використовуєте інший Plugin пам’яті, задайте config.toolsAllow як точні назви
інструментів, які реєструє цей Plugin. Active Memory перелічує ці інструменти в запиті
пригадування й передає той самий список вбудованому під-агенту. Якщо жоден із
налаштованих інструментів недоступний або під-агент пам’яті дає збій, Active Memory
пропускає пригадування для цього ходу, а основна відповідь продовжується без контексту пам’яті.
toolsAllow приймає лише конкретні назви інструментів пам’яті. Шаблони, записи group:*
і базові інструменти агента, як-от read, exec, message і
web_search, ігноруються до запуску прихованого під-агента пам’яті.
Примітка щодо стандартної поведінки: Active Memory більше не включає memory_recall до
стандартного списку дозволених для memory-core. Наявні налаштування memory-lancedb продовжують працювати,
коли plugins.slots.memory задано як memory-lancedb. Явний toolsAllow
завжди перевизначає автоматичний стандарт.
Вбудований memory-core
Стандартне налаштування не потребує явногоtoolsAllow:
Пам’ять LanceDB
Укомплектований Pluginmemory-lancedb надає memory_recall. Вибору
слота пам’яті достатньо, щоб Active Memory використовувала цей інструмент пригадування:
Lossless Claw
Lossless Claw — це Plugin контекстного рушія з власними інструментами пригадування. Спочатку встановіть і налаштуйте його як контекстний рушій; див. Контекстний рушій. Потім дозвольте Active Memory використовувати інструменти пригадування Lossless Claw:lcm_expand у toolsAllow для основного під-агента Active Memory.
Lossless Claw використовує його як нижчорівневий делегований інструмент розгортання.
Розширені запасні механізми
Ці параметри навмисно не входять до рекомендованого налаштування.config.thinking може перевизначити рівень мислення блокувального під-агента пам’яті:
config.promptAppend додає додаткові операторські інструкції після стандартного запиту Active
Memory і перед контекстом розмови:
promptAppend з власним toolsAllow, коли неосновному Plugin пам’яті потрібні
специфічний для провайдера порядок інструментів або інструкції щодо формування запитів.
config.promptOverride замінює стандартний запит Active Memory. OpenClaw
усе одно додає контекст розмови після нього:
NONE,
або компактний контекст фактів про користувача для основної моделі.
Збереження транскриптів
Запуски блокувального під-агента пам’яті Active Memory створюють справжній транскриптsession.jsonl
під час виклику блокувального під-агента пам’яті.
За замовчуванням цей транскрипт тимчасовий:
- він записується до тимчасового каталогу
- він використовується лише для запуску блокувального під-агента пам’яті
- він видаляється одразу після завершення запуску
config.transcriptDir.
Використовуйте це обережно:
- транскрипти блокувального під-агента пам’яті можуть швидко накопичуватися в активних сеансах
- режим запиту
fullможе дублювати багато контексту розмови - ці транскрипти містять прихований контекст запиту та пригадані спогади
Конфігурація
Уся конфігурація active memory розміщується в:| Ключ | Тип | Значення |
|---|---|---|
enabled | boolean | Вмикає сам Plugin |
config.agents | string[] | Ідентифікатори агентів, які можуть використовувати Active Memory |
config.model | string | Необов’язкове посилання на модель блокувального підагента пам’яті; якщо не задано, Active Memory використовує модель поточного сеансу |
config.allowedChatTypes | ("direct" | "group" | "channel")[] | Типи сеансів, у яких може виконуватися Active Memory; за замовчуванням це сеанси у стилі прямих повідомлень |
config.allowedChatIds | string[] | Необов’язковий список дозволених розмов, що застосовується після allowedChatTypes; непорожні списки забороняють доступ за замовчуванням |
config.deniedChatIds | string[] | Необов’язковий список заборонених розмов, який перевизначає дозволені типи сеансів і дозволені ідентифікатори |
config.queryMode | "message" | "recent" | "full" | Керує тим, який обсяг розмови бачить блокувальний підагент пам’яті |
config.promptStyle | "balanced" | "strict" | "contextual" | "recall-heavy" | "precision-heavy" | "preference-only" | Керує тим, наскільки охоче або суворо блокувальний підагент пам’яті вирішує, чи повертати пам’ять |
config.toolsAllow | string[] | Конкретні назви інструментів пам’яті, які може викликати блокувальний підагент пам’яті; за замовчуванням ["memory_search", "memory_get"] або ["memory_recall"], коли plugins.slots.memory дорівнює memory-lancedb; шаблони з підстановками, записи group:* та інструменти основного агента ігноруються |
config.thinking | "off" | "minimal" | "low" | "medium" | "high" | "xhigh" | "adaptive" | "max" | Розширене перевизначення мислення для блокувального підагента пам’яті; за замовчуванням off для швидкості |
config.promptOverride | string | Розширена повна заміна промпта; не рекомендовано для звичайного використання |
config.promptAppend | string | Розширені додаткові інструкції, що додаються до стандартного або перевизначеного промпта |
config.timeoutMs | number | Жорсткий тайм-аут для блокувального підагента пам’яті, обмежений 120000 мс |
config.setupGraceTimeoutMs | number | Розширений додатковий бюджет налаштування до завершення тайм-ауту пригадування; за замовчуванням 0 і обмежується 30000 мс. Див. Пільговий період холодного старту для рекомендацій щодо оновлення v2026.4.x |
config.maxSummaryChars | number | Максимальна загальна кількість символів, дозволена у зведенні Active Memory |
config.logging | boolean | Виводить журнали Active Memory під час налаштування |
config.persistTranscripts | boolean | Зберігає транскрипти блокувального підагента пам’яті на диску замість видалення тимчасових файлів |
config.transcriptDir | string | Відносний каталог транскриптів блокувального підагента пам’яті в папці сеансів агента |
| Ключ | Тип | Значення |
|---|---|---|
config.maxSummaryChars | number | Максимальна загальна кількість символів, дозволена у зведенні Active Memory |
config.recentUserTurns | number | Попередні репліки користувача, які слід включити, коли queryMode дорівнює recent |
config.recentAssistantTurns | number | Попередні репліки асистента, які слід включити, коли queryMode дорівнює recent |
config.recentUserChars | number | Максимум символів на кожну нещодавню репліку користувача |
config.recentAssistantChars | number | Максимум символів на кожну нещодавню репліку асистента |
config.cacheTtlMs | number | Повторне використання кешу для повторюваних ідентичних запитів (діапазон: 1000-120000 мс; за замовчуванням: 15000) |
config.circuitBreakerMaxTimeouts | number | Пропускати пригадування після цієї кількості послідовних тайм-аутів для того самого агента/моделі. Скидається після успішного пригадування або завершення періоду охолодження (діапазон: 1-20; за замовчуванням: 3). |
config.circuitBreakerCooldownMs | number | Як довго пропускати пригадування після спрацювання автоматичного вимикача, у мс (діапазон: 5000-600000; за замовчуванням: 60000). |
Рекомендоване налаштування
Почніть ізrecent.
/verbose on для
звичайного рядка стану та /trace on для налагоджувального зведення Active Memory замість
пошуку окремої команди налагодження Active Memory. У чат-каналах ці
діагностичні рядки надсилаються після основної відповіді асистента, а не перед нею.
Потім перейдіть до:
message, якщо потрібна менша затримкаfull, якщо ви вирішите, що додатковий контекст вартий повільнішого блокувального підагента пам’яті
Пільговий період холодного старту
До v2026.5.2 Plugin непомітно подовжував налаштований вамиtimeoutMs на
додаткові 30000 мс під час холодного старту, щоб прогрівання моделі, завантаження індексу ембедингів і
перше пригадування могли спільно використовувати один більший бюджет. У v2026.5.2 цей пільговий період
перенесено за явну конфігурацію setupGraceTimeoutMs — налаштований вами timeoutMs
тепер є бюджетом за замовчуванням, якщо ви явно не ввімкнете інше.
Якщо ви оновилися з v2026.4.x і встановили timeoutMs на значення, підібране для
старої моделі з неявним пільговим періодом (timeoutMs: 15000 з рекомендованого стартового налаштування є одним
прикладом), встановіть setupGraceTimeoutMs: 30000, щоб розширити бюджет хуку побудови промпта та
зовнішнього сторожового таймера до ефективних значень, що були до v5.2:
setupGraceTimeoutMs, щоб Plugin більше не подовжував непомітно
конфігурації 15000 мс до 45000 мс на основній лінії.”
Вбудований запуск recall використовує той самий ефективний бюджет тайм-ауту, тож
setupGraceTimeoutMs охоплює як зовнішній watchdog побудови prompt, так і внутрішній
блокувальний запуск recall.
Для ресурсно обмежених Gateway, де затримка холодного старту є відомим компромісом,
нижчі значення (5000–15000 мс) також працюють — компроміс полягає у вищій імовірності,
що найперший recall після перезапуску Gateway поверне порожній результат, поки
завершується прогрівання.
Налагодження
Якщо Active Memory не з’являється там, де ви очікуєте:- Переконайтеся, що plugin увімкнено в
plugins.entries.active-memory.enabled. - Переконайтеся, що поточний id агента вказано в
config.agents. - Переконайтеся, що ви тестуєте через інтерактивний сталий сеанс чату.
- Увімкніть
config.logging: trueі стежте за журналами Gateway. - Перевірте, що сам пошук пам’яті працює за допомогою
openclaw memory status --deep.
maxSummaryChars
- зменште
queryMode - зменште
timeoutMs - зменште кількість останніх реплік
- зменште обмеження символів на репліку
Поширені проблеми
Active Memory працює поверх налаштованого pipeline recall у memory plugin, тому більшість несподіванок recall спричинені проблемами embedding-провайдера, а не помилками Active Memory. Шляхmemory-core за замовчуванням використовує memory_search і memory_get; слот
memory-lancedb використовує memory_recall. Якщо ви використовуєте інший memory plugin,
переконайтеся, що config.toolsAllow називає інструменти, які цей plugin фактично реєструє.
Embedding-провайдер змінився або перестав працювати
Embedding-провайдер змінився або перестав працювати
Якщо
memorySearch.provider не задано, OpenClaw автоматично визначає першого
доступного embedding-провайдера. Новий API-ключ, вичерпання квоти або
rate-limited hosted provider можуть змінити, який провайдер визначається між
запусками. Якщо жоден провайдер не визначено, memory_search може деградувати до
пошуку лише за лексичними збігами; runtime-помилки після того, як провайдера вже вибрано,
не перемикаються автоматично на fallback.Явно зафіксуйте провайдера (і необов’язковий fallback), щоб зробити вибір
детермінованим. Див. Пошук пам’яті для повного
списку провайдерів і прикладів фіксації.Recall здається повільним, порожнім або нестабільним
Recall здається повільним, порожнім або нестабільним
- Увімкніть
/trace on, щоб показати в сеансі debug-зведення Active Memory, яке належить plugin. - Увімкніть
/verbose on, щоб також бачити рядок стану🧩 Active Memory: ...після кожної відповіді. - Стежте за журналами Gateway на наявність
active-memory: ... start|done,memory sync failed (search-bootstrap)або помилок provider embedding. - Запустіть
openclaw memory status --deep, щоб перевірити backend пошуку пам’яті та стан індексу. - Якщо ви використовуєте
ollama, переконайтеся, що embedding-модель установлено (ollama list).
Перший recall після перезапуску Gateway повертає `status=timeout`
Перший recall після перезапуску Gateway повертає `status=timeout`
У v2026.5.2 і новіших версіях, якщо налаштування холодного старту (прогрівання моделі +
завантаження embedding-індексу) не завершилося до моменту першого запуску recall,
виконання може вичерпати налаштований бюджет
timeoutMs і повернути status=timeout
з порожнім виводом. Журнали Gateway показують active-memory timeout after Nms
біля першої придатної відповіді після перезапуску.Див. Grace-період холодного старту у рекомендованому налаштуванні щодо
рекомендованого значення setupGraceTimeoutMs.