Active memory 是選用的 Plugin 所擁有的阻塞式記憶子代理,會在符合資格的對話工作階段中,於主要回覆前執行。 它存在的原因是,多數記憶系統雖然能力完整,卻是被動反應式的。它們依賴主要代理決定何時搜尋記憶,或依賴使用者說出像是「記住這件事」或「搜尋記憶」這類話。等到那時,記憶原本能讓回覆感覺自然的時機已經過去了。 Active Memory 讓系統有一次有界限的機會,在產生主要回覆前浮現相關記憶。Documentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
快速開始
將這段貼到openclaw.json,即可使用安全預設設定 — Plugin 啟用、範圍限定在 main 代理、僅限直接訊息工作階段,並在可用時繼承工作階段模型:
plugins.entries.active-memory.enabled: true會啟用 Pluginconfig.agents: ["main"]只讓main代理加入 Active Memoryconfig.allowedChatTypes: ["direct"]將範圍限定在直接訊息工作階段(群組/頻道需明確加入)config.model(選用)會固定使用專用回想模型;未設定時會繼承目前工作階段模型config.modelFallback只會在沒有明確或繼承模型可解析時使用config.promptStyle: "balanced"是recent模式的預設值- Active Memory 仍然只會在符合資格的互動式持久聊天工作階段中執行
速度建議
最簡單的設定是讓config.model 保持未設定,並讓 Active Memory 使用你已經用於一般回覆的同一個模型。這是最安全的預設值,因為它會遵循你既有的供應商、驗證和模型偏好。
如果你希望 Active Memory 感覺更快,請使用專用推論模型,而不是借用主要聊天模型。回想品質很重要,但延遲比主要答案路徑更重要,而且 Active Memory 的工具介面很窄(它只會呼叫可用的記憶回想工具)。
好的快速模型選項:
cerebras/gpt-oss-120b,作為專用低延遲回想模型google/gemini-3-flash,作為不變更主要聊天模型的低延遲備援- 透過讓
config.model保持未設定來使用你的正常工作階段模型
Cerebras 設定
加入 Cerebras 供應商,並讓 Active Memory 指向它:chat/completions 存取權 — 只有 /v1/models 可見並不保證可以使用它。
如何查看
Active Memory 會為模型注入隱藏的不受信任提示前綴。它不會在一般客戶端可見回覆中暴露原始<active_memory_plugin>...</active_memory_plugin> 標籤。
工作階段切換
當你想暫停或恢復目前聊天工作階段的 Active Memory,而不編輯設定時,請使用 Plugin 指令:plugins.entries.active-memory.enabled、代理目標或其他全域設定。
如果你希望指令寫入設定,並針對所有工作階段暫停或恢復 Active Memory,請使用明確的全域形式:
plugins.entries.active-memory.config.enabled。它會讓 plugins.entries.active-memory.enabled 保持開啟,因此稍後仍可使用該指令重新開啟 Active Memory。
如果你想在即時工作階段中查看 Active Memory 正在做什麼,請開啟符合所需輸出的工作階段切換:
- 當
/verbose on時,顯示像是Active Memory: status=ok elapsed=842ms query=recent summary=34 chars的 Active Memory 狀態列 - 當
/trace on時,顯示像是Active Memory Debug: Lemon pepper wings with blue cheese.的可讀偵錯摘要
/trace raw,追蹤的 Model Input (User Role) 區塊會將隱藏的 Active Memory 前綴顯示為:
執行時機
Active Memory 使用兩道閘門:- 設定加入
Plugin 必須已啟用,而且目前代理 id 必須出現在
plugins.entries.active-memory.config.agents中。 - 嚴格執行階段資格 即使已啟用並已指定目標,Active Memory 也只會在符合資格的互動式持久聊天工作階段中執行。
工作階段類型
config.allowedChatTypes 控制哪些種類的對話可以執行 Active Memory。
預設值是:
config.allowedChatIds 和 config.deniedChatIds。
allowedChatIds 是已解析對話 id 的明確允許清單。當它非空時,Active Memory 只會在工作階段的對話 id 位於該清單中時執行。這會一次縮小每一種允許的聊天類型,包括直接訊息。如果你想允許所有直接訊息外加特定群組,請將直接對等 id 納入 allowedChatIds,或讓 allowedChatTypes 聚焦在你正在測試的群組/頻道推出。
deniedChatIds 是明確拒絕清單。它永遠優先於 allowedChatTypes 和 allowedChatIds,因此即使某個相符對話的工作階段類型原本被允許,也會被略過。
id 來自持久頻道工作階段鍵:例如 Feishu chat_id / open_id、Telegram 聊天 id,或 Slack 頻道 id。比對不區分大小寫。如果 allowedChatIds 非空,而且 OpenClaw 無法解析該工作階段的對話 id,Active Memory 會略過該輪,而不是猜測。
範例:
執行位置
Active Memory 是對話增強功能,不是整個平台範圍的推論功能。| 介面 | 是否執行 Active Memory? |
|---|---|
| 控制 UI / 網頁聊天持久工作階段 | 是,前提是 Plugin 已啟用且代理已指定為目標 |
| 位於相同持久聊天路徑上的其他互動式頻道工作階段 | 是,前提是 Plugin 已啟用且代理已指定為目標 |
| 無頭一次性執行 | 否 |
| Heartbeat/背景執行 | 否 |
通用內部 agent-command 路徑 | 否 |
| 子代理/內部輔助執行 | 否 |
為何使用它
在以下情況使用 Active Memory:- 工作階段是持久且面向使用者的
- 代理有值得搜尋的有意義長期記憶
- 連續性和個人化比原始提示確定性更重要
- 穩定偏好
- 重複出現的習慣
- 應自然浮現的長期使用者脈絡
- 自動化
- 內部工作者
- 一次性 API 任務
- 隱藏個人化會令人意外的地方
運作方式
執行階段形狀是: 阻塞式記憶子代理只能使用已設定的記憶回想工具。預設是:memory_searchmemory_get
plugins.slots.memory 是 memory-lancedb 時,預設會改用 memory_recall。當另一個記憶供應商暴露不同的回想工具合約時,請設定 config.toolsAllow。
如果連結很弱,它應該回傳 NONE。
查詢模式
config.queryMode 控制阻塞式記憶子代理可以看到多少對話。請選擇仍能妥善回答後續問題的最小模式;逾時預算應隨脈絡大小增加(message < recent < full)。
- message
- recent
- full
只會送出最新的使用者訊息。適用於:
- 你想要最快的行為
- 你想要最強烈偏向穩定偏好回想
- 後續輪次不需要對話脈絡
config.timeoutMs 可從大約 3000 到 5000 ms 開始。提示樣式
config.promptStyle 控制阻塞式記憶子代理在判斷是否回傳記憶時的
積極或嚴格程度。
可用樣式:
balanced:recent模式的一般用途預設值strict:最不積極;適合你希望附近脈絡極少滲入時使用contextual:最有利於連續性;適合對話歷史應該更重要時使用recall-heavy:更願意在較弱但仍合理的匹配上呈現記憶precision-heavy:除非匹配很明顯,否則積極偏好NONEpreference-only:針對喜好、習慣、例行事項、品味和反覆出現的個人事實最佳化
config.promptStyle 時的預設對應:
config.promptStyle,該覆寫會優先。
範例:
模型備援政策
如果未設定config.model,Active Memory 會依下列順序嘗試解析模型:
config.modelFallback 控制已設定的備援步驟。
選用的自訂備援:
config.modelFallbackPolicy 僅作為較舊設定的已棄用相容性欄位保留。
它不再改變執行階段行為。
記憶工具
預設情況下,Active Memory 允許阻塞式回想子代理呼叫memory_search 和 memory_get。這符合內建 memory-core
合約。當 plugins.slots.memory 選擇 memory-lancedb 且
未設定 config.toolsAllow 時,Active Memory 會保留既有 LanceDB 行為
並改用 memory_recall。
如果你使用其他記憶 Plugin,請將 config.toolsAllow 設為該 Plugin 註冊的確切工具
名稱。Active Memory 會在回想提示中列出那些工具,
並將同一份清單傳給嵌入式子代理。如果已設定的工具都不可用,
或記憶子代理失敗,Active Memory
會略過該輪回想,而主要回覆會在沒有記憶脈絡的情況下繼續。
toolsAllow 只接受具體的記憶工具名稱。萬用字元、group:*
項目,以及 read、exec、message 和
web_search 等核心代理工具,都會在隱藏記憶子代理啟動前被忽略。
預設行為注意事項:Active Memory 不再將 memory_recall 納入
memory-core 預設允許清單。當 plugins.slots.memory 設為 memory-lancedb 時,
既有 memory-lancedb 設定仍會繼續運作。明確的 toolsAllow
一律會覆寫自動預設值。
內建 memory-core
預設設定不需要明確的toolsAllow:
LanceDB 記憶
隨附的memory-lancedb Plugin 會公開 memory_recall。選取
記憶槽就足以讓 Active Memory 使用該回想工具:
Lossless Claw
Lossless Claw 是一個具備自身回想工具的脈絡引擎 Plugin。請先將它作為脈絡引擎安裝並 設定;請參閱脈絡引擎。 接著讓 Active Memory 使用 Lossless Claw 回想工具:toolsAllow 中包含 lcm_expand。
Lossless Claw 會將其作為較低階的委派展開工具使用。
進階應急選項
這些選項刻意不屬於建議設定的一部分。config.thinking 可以覆寫阻塞式記憶子代理的思考層級:
config.promptAppend 會在預設 Active
Memory 提示之後、對話脈絡之前加入額外的操作員指示:
toolsAllow 使用 promptAppend。
config.promptOverride 會取代預設 Active Memory 提示。OpenClaw
仍會在之後附加對話脈絡:
NONE
或供主要模型使用的精簡使用者事實脈絡進行調校。
逐字稿持久化
Active Memory 阻塞式記憶子代理執行時,會在阻塞式記憶子代理呼叫期間建立真正的session.jsonl
逐字稿。
預設情況下,該逐字稿是暫時的:
- 它會寫入暫存目錄
- 它只用於阻塞式記憶子代理執行
- 它會在執行完成後立即刪除
config.transcriptDir 變更相對子目錄。
請謹慎使用:
- 阻塞式記憶子代理逐字稿可能會在繁忙的 session 中快速累積
full查詢模式可能會複製大量對話脈絡- 這些逐字稿包含隱藏提示脈絡和已回想的記憶
設定
所有 Active Memory 設定都位於:| Key | Type | 意義 |
|---|---|---|
enabled | boolean | 啟用 Plugin 本身 |
config.agents | string[] | 可使用 Active Memory 的代理 ID |
config.model | string | 選用的阻塞式記憶子代理模型參照;未設定時,Active Memory 會使用目前的工作階段模型 |
config.allowedChatTypes | ("direct" | "group" | "channel")[] | 可執行 Active Memory 的工作階段類型;預設為直接訊息樣式的工作階段 |
config.allowedChatIds | string[] | 選用的每對話允許清單,會在 allowedChatTypes 之後套用;非空清單會以封閉失敗處理 |
config.deniedChatIds | string[] | 選用的每對話拒絕清單,會覆寫允許的工作階段類型與允許的 ID |
config.queryMode | "message" | "recent" | "full" | 控制阻塞式記憶子代理可看到多少對話內容 |
config.promptStyle | "balanced" | "strict" | "contextual" | "recall-heavy" | "precision-heavy" | "preference-only" | 控制阻塞式記憶子代理在決定是否回傳記憶時的積極或嚴格程度 |
config.toolsAllow | string[] | 阻塞式記憶子代理可呼叫的具體記憶工具名稱;預設為 ["memory_search", "memory_get"],或當 plugins.slots.memory 為 memory-lancedb 時使用 ["memory_recall"];萬用字元、group:* 項目與核心代理工具會被忽略 |
config.thinking | "off" | "minimal" | "low" | "medium" | "high" | "xhigh" | "adaptive" | "max" | 阻塞式記憶子代理的進階思考覆寫;為了速度,預設為 off |
config.promptOverride | string | 進階完整提示替換;不建議一般使用 |
config.promptAppend | string | 附加到預設或覆寫提示的進階額外指示 |
config.timeoutMs | number | 阻塞式記憶子代理的硬性逾時,上限為 120000 ms |
config.setupGraceTimeoutMs | number | 召回逾時到期前的進階額外設定預算;預設為 0,且上限為 30000 ms。如需 v2026.4.x 升級指引,請參閱冷啟動寬限 |
config.maxSummaryChars | number | Active Memory 摘要允許的最大總字元數 |
config.logging | boolean | 調校時發出 Active Memory 記錄 |
config.persistTranscripts | boolean | 將阻塞式記憶子代理逐字稿保留在磁碟上,而不是刪除暫存檔 |
config.transcriptDir | string | 代理工作階段資料夾下的相對阻塞式記憶子代理逐字稿目錄 |
| Key | Type | 意義 |
|---|---|---|
config.maxSummaryChars | number | Active Memory 摘要允許的最大總字元數 |
config.recentUserTurns | number | 當 queryMode 為 recent 時要包含的先前使用者回合 |
config.recentAssistantTurns | number | 當 queryMode 為 recent 時要包含的先前助理回合 |
config.recentUserChars | number | 每個近期使用者回合的最大字元數 |
config.recentAssistantChars | number | 每個近期助理回合的最大字元數 |
config.cacheTtlMs | number | 重複相同查詢的快取重用時間(範圍:1000-120000 ms;預設:15000) |
config.circuitBreakerMaxTimeouts | number | 同一代理/模型連續逾時達到此數量後跳過召回。成功召回或冷卻到期後重設(範圍:1-20;預設:3)。 |
config.circuitBreakerCooldownMs | number | 斷路器觸發後跳過召回的時間長度,以 ms 為單位(範圍:5000-600000;預設:60000)。 |
建議設定
從recent 開始。
/verbose on 查看一般狀態列,並使用 /trace on 查看 Active Memory 偵錯摘要,而不是尋找個別的 Active Memory 偵錯命令。在聊天通道中,這些診斷行會在主要助理回覆之後送出,而不是在之前送出。
接著移至:
- 如果你想要較低延遲,使用
message - 如果你認為額外脈絡值得承受較慢的阻塞式記憶子代理,使用
full
冷啟動寬限
在 v2026.5.2 之前,Plugin 會在冷啟動期間靜默地將你設定的timeoutMs 額外延長 30000 ms,讓模型暖機、嵌入索引載入與首次召回可共用一個較大的預算。v2026.5.2 將該寬限移到明確的 setupGraceTimeoutMs 設定之後:除非你選擇加入,否則現在預設會以你設定的 timeoutMs 作為預算。
如果你是從 v2026.4.x 升級,且你將 timeoutMs 設為針對舊有隱含寬限世界調校的值(建議的入門 timeoutMs: 15000 就是一例),請設定 setupGraceTimeoutMs: 30000,將提示建置 hook 與外層 watchdog 預算延長回 v5.2 之前的有效值:
setupGraceTimeoutMs 設定之後,因此 Plugin 不再於主通道上將 15000 ms 設定靜默延長為 45000 ms。”
嵌入式回憶執行器使用相同的有效逾時預算,因此
setupGraceTimeoutMs 同時涵蓋外層提示建構 watchdog 和內層
阻塞式回憶執行。
對於資源緊繃、且已知冷啟動延遲是一項取捨的 Gateway,
較低的值(5000–15000 ms)也可運作 — 取捨是 Gateway 重新啟動後,
第一次回憶在暖機完成前回傳空結果的機率較高。
偵錯
如果 Active Memory 沒有出現在你預期的位置:- 確認 Plugin 已在
plugins.entries.active-memory.enabled下啟用。 - 確認目前的 agent id 已列在
config.agents中。 - 確認你是透過互動式持久聊天工作階段進行測試。
- 開啟
config.logging: true並觀察 Gateway 日誌。 - 使用
openclaw memory status --deep驗證記憶搜尋本身可以運作。
maxSummaryChars
- 降低
queryMode - 降低
timeoutMs - 減少近期回合數
- 降低每回合字元上限
常見問題
Active Memory 建立在已設定記憶 Plugin 的回憶管線之上,因此大多數 回憶異常都是 embedding provider 問題,而不是 Active Memory bug。預設的memory-core 路徑使用 memory_search 和 memory_get;memory-lancedb
槽位使用 memory_recall。如果你使用另一個記憶 Plugin,
請確認 config.toolsAllow 命名了該 Plugin 實際註冊的工具。
Embedding provider 已切換或停止運作
Embedding provider 已切換或停止運作
如果未設定
memorySearch.provider,OpenClaw 會自動偵測第一個
可用的 embedding provider。新的 API key、配額耗盡,或
受速率限制的託管 provider,都可能讓兩次執行之間解析出的 provider
發生變化。如果沒有解析出任何 provider,memory_search 可能會降級為僅詞彙式
擷取;在 provider 已選定後發生的執行階段失敗不會
自動 fallback。明確固定 provider(以及選用的 fallback),讓選擇具備
決定性。完整的 provider 清單與固定範例請參閱 記憶搜尋。回憶感覺緩慢、空白或不一致
回憶感覺緩慢、空白或不一致
- 開啟
/trace on,在工作階段中顯示 Plugin 擁有的 Active Memory 偵錯 摘要。 - 開啟
/verbose on,以便在每次回覆後也看到🧩 Active Memory: ...狀態列。 - 觀察 Gateway 日誌中是否有
active-memory: ... start|done、memory sync failed (search-bootstrap),或 provider embedding 錯誤。 - 執行
openclaw memory status --deep以檢查記憶搜尋後端 與索引健康狀態。 - 如果你使用
ollama,請確認 embedding model 已安裝 (ollama list)。
Gateway 重新啟動後第一次回憶回傳 `status=timeout`
Gateway 重新啟動後第一次回憶回傳 `status=timeout`
在 v2026.5.2 及更新版本中,如果冷啟動設定(model 暖機 + embedding
索引載入)尚未在第一次回憶觸發前完成,該次執行
可能會命中已設定的
timeoutMs 預算,並以空輸出回傳 status=timeout。
Gateway 日誌會在重新啟動後第一次符合資格的回覆附近顯示
active-memory timeout after Nms。建議的 setupGraceTimeoutMs 值請參閱建議設定中的
冷啟動寬限。