Active Memory는 적합한 대화 세션에서 기본 응답 전에 실행되는, 선택 사항인 Plugin 소유 차단형 메모리 하위 에이전트입니다. 대부분의 메모리 시스템은 유능하지만 반응형이기 때문에 존재합니다. 이들은 메인 에이전트가 언제 메모리를 검색할지 결정하거나, 사용자가 “이것을 기억해” 또는 “메모리 검색” 같은 말을 하기를 의존합니다. 그 시점에는 메모리가 응답을 자연스럽게 느끼게 만들 수 있었던 순간이 이미 지나간 뒤입니다. Active Memory는 기본 응답이 생성되기 전에 관련 메모리를 드러낼 수 있는 제한된 한 번의 기회를 시스템에 제공합니다.Documentation Index
Fetch the complete documentation index at: https://docs2.openclaw.ai/llms.txt
Use this file to discover all available pages before exploring further.
빠른 시작
안전한 기본 설정으로openclaw.json에 다음을 붙여넣으세요. Plugin은 켜져 있고, main 에이전트로 범위가 지정되며, 직접 메시지 세션에만 적용되고, 가능한 경우 세션 모델을 상속합니다.
plugins.entries.active-memory.enabled: true는 Plugin을 켭니다config.agents: ["main"]는main에이전트만 Active Memory에 옵트인합니다config.allowedChatTypes: ["direct"]는 직접 메시지 세션으로 범위를 제한합니다(그룹/채널은 명시적으로 옵트인)config.model(선택 사항)은 전용 회상 모델을 고정합니다. 설정하지 않으면 현재 세션 모델을 상속합니다config.modelFallback은 명시적 모델이나 상속된 모델이 해석되지 않을 때만 사용됩니다config.promptStyle: "balanced"는recent모드의 기본값입니다- Active Memory는 여전히 적합한 대화형 영속 채팅 세션에서만 실행됩니다
속도 권장 사항
가장 단순한 설정은config.model을 설정하지 않고 Active Memory가 일반 응답에 이미 사용하는 것과 동일한 모델을 사용하게 두는 것입니다. 이는 기존 provider, 인증, 모델 선호도를 따르기 때문에 가장 안전한 기본값입니다.
Active Memory가 더 빠르게 느껴지게 하려면 메인 채팅 모델을 빌리는 대신 전용 추론 모델을 사용하세요. 회상 품질도 중요하지만 기본 응답 경로보다 지연 시간이 더 중요하며, Active Memory의 도구 표면은 좁습니다(사용 가능한 메모리 회상 도구만 호출합니다).
좋은 빠른 모델 옵션:
- 전용 저지연 회상 모델로
cerebras/gpt-oss-120b - 기본 채팅 모델을 바꾸지 않는 저지연 fallback으로
google/gemini-3-flash config.model을 설정하지 않고 사용하는 일반 세션 모델
Cerebras 설정
Cerebras provider를 추가하고 Active Memory가 이를 가리키게 하세요.chat/completions 접근 권한을 갖고 있는지 확인하세요. /v1/models에 표시된다는 것만으로는 이를 보장하지 않습니다.
확인 방법
Active Memory는 모델에 숨겨진 신뢰할 수 없는 프롬프트 접두사를 주입합니다. 일반 클라이언트 표시 응답에는 원시<active_memory_plugin>...</active_memory_plugin> 태그를 노출하지 않습니다.
세션 토글
설정을 편집하지 않고 현재 채팅 세션에서 Active Memory를 일시 중지하거나 재개하려면 Plugin 명령을 사용하세요.plugins.entries.active-memory.enabled, 에이전트 대상 지정, 기타 전역 구성을 변경하지 않습니다.
명령이 설정을 기록하고 모든 세션에서 Active Memory를 일시 중지하거나 재개하게 하려면 명시적 전역 형식을 사용하세요.
plugins.entries.active-memory.config.enabled를 기록합니다. 나중에 명령으로 Active Memory를 다시 켤 수 있도록 plugins.entries.active-memory.enabled는 켜진 상태로 둡니다.
실시간 세션에서 Active Memory가 무엇을 하는지 보려면 원하는 출력에 맞는 세션 토글을 켜세요.
/verbose on일 때Active Memory: status=ok elapsed=842ms query=recent summary=34 chars같은 Active Memory 상태 줄/trace on일 때Active Memory Debug: Lemon pepper wings with blue cheese.같은 읽기 쉬운 디버그 요약
/trace raw도 활성화하면, 추적된 Model Input (User Role) 블록에 숨겨진 Active Memory 접두사가 다음처럼 표시됩니다.
실행 시점
Active Memory는 두 가지 gate를 사용합니다.- 구성 옵트인
Plugin이 활성화되어 있어야 하며, 현재 에이전트 id가
plugins.entries.active-memory.config.agents에 나타나야 합니다. - 엄격한 런타임 적합성 활성화되고 대상으로 지정되어 있더라도, Active Memory는 적합한 대화형 영속 채팅 세션에서만 실행됩니다.
세션 유형
config.allowedChatTypes는 어떤 종류의 대화에서 Active Memory를 실행할 수 있는지 제어합니다.
기본값은 다음과 같습니다.
config.allowedChatIds와 config.deniedChatIds를 사용하세요.
allowedChatIds는 해석된 대화 id의 명시적 allowlist입니다. 비어 있지 않으면, Active Memory는 세션의 대화 id가 해당 목록에 있을 때만 실행됩니다. 이는 직접 메시지를 포함해 모든 허용된 채팅 유형을 한 번에 좁힙니다. 모든 직접 메시지와 특정 그룹만 원한다면, 직접 peer id를 allowedChatIds에 포함하거나 테스트 중인 그룹/채널 롤아웃에 맞춰 allowedChatTypes를 유지하세요.
deniedChatIds는 명시적 denylist입니다. 이는 항상 allowedChatTypes와 allowedChatIds보다 우선하므로, 일치하는 대화는 세션 유형이 otherwise 허용되더라도 건너뜁니다.
id는 영속 채널 세션 키에서 옵니다. 예를 들어 Feishu chat_id / open_id, Telegram 채팅 id, 또는 Slack 채널 id입니다. 일치는 대소문자를 구분하지 않습니다. allowedChatIds가 비어 있지 않은데 OpenClaw가 세션의 대화 id를 해석할 수 없으면, Active Memory는 추측하지 않고 해당 턴을 건너뜁니다.
예시:
실행 위치
Active Memory는 대화 보강 기능이지, 플랫폼 전반의 추론 기능이 아닙니다.| 표면 | Active Memory 실행 여부 |
|---|---|
| Control UI / 웹 채팅 영속 세션 | 예, Plugin이 활성화되어 있고 에이전트가 대상이면 |
| 동일한 영속 채팅 경로의 기타 대화형 채널 세션 | 예, Plugin이 활성화되어 있고 에이전트가 대상이면 |
| Headless 일회성 실행 | 아니요 |
| Heartbeat/백그라운드 실행 | 아니요 |
일반 내부 agent-command 경로 | 아니요 |
| 하위 에이전트/내부 helper 실행 | 아니요 |
사용하는 이유
다음과 같은 경우 Active Memory를 사용하세요.- 세션이 영속적이고 사용자에게 표시됨
- 에이전트에 검색할 의미 있는 장기 메모리가 있음
- 원시 프롬프트 결정성보다 연속성과 개인화가 더 중요함
- 안정적인 선호도
- 반복되는 습관
- 자연스럽게 드러나야 하는 장기 사용자 맥락
- 자동화
- 내부 worker
- 일회성 API 작업
- 숨겨진 개인화가 놀라움을 줄 수 있는 위치
작동 방식
런타임 형태는 다음과 같습니다. 차단형 메모리 하위 에이전트는 구성된 메모리 회상 도구만 사용할 수 있습니다. 기본값은 다음과 같습니다.memory_searchmemory_get
plugins.slots.memory가 memory-lancedb일 때는 대신 기본값이 memory_recall입니다. 다른 메모리 provider가 다른 회상 도구 contract를 노출할 때는 config.toolsAllow를 설정하세요.
연결성이 약하면 NONE을 반환해야 합니다.
쿼리 모드
config.queryMode는 차단형 메모리 하위 에이전트가 볼 수 있는 대화량을 제어합니다. 후속 질문에 여전히 잘 답할 수 있는 가장 작은 모드를 선택하세요. timeout budget은 context 크기에 따라 커져야 합니다(message < recent < full).
- message
- recent
- full
최신 사용자 메시지만 전송됩니다.다음과 같은 경우 사용하세요.
- 가장 빠른 동작을 원함
- 안정적인 선호도 회상 쪽으로 가장 강한 편향을 원함
- 후속 턴에 대화 맥락이 필요하지 않음
config.timeoutMs는 3000~5000 ms 정도에서 시작하세요.프롬프트 스타일
config.promptStyle은 메모리를 반환할지 결정할 때 차단 메모리 하위 에이전트가 얼마나 적극적이거나 엄격하게 동작하는지를 제어합니다.
사용 가능한 스타일:
balanced:recent모드의 범용 기본값strict: 가장 덜 적극적이며, 근처 컨텍스트에서 번지는 영향을 아주 적게 원할 때 가장 적합contextual: 연속성에 가장 친화적이며, 대화 기록이 더 중요해야 할 때 가장 적합recall-heavy: 더 약하지만 여전히 그럴듯한 일치에서도 메모리를 더 기꺼이 표시precision-heavy: 일치가 명확하지 않으면 적극적으로NONE을 선호preference-only: 즐겨찾기, 습관, 루틴, 취향, 반복되는 개인 정보에 최적화
config.promptStyle이 설정되지 않았을 때의 기본 매핑:
config.promptStyle을 명시적으로 설정하면 해당 재정의가 우선합니다.
예:
모델 폴백 정책
config.model이 설정되지 않은 경우 Active Memory는 다음 순서로 모델 확인을 시도합니다.
config.modelFallback은 구성된 폴백 단계를 제어합니다.
선택 사항인 사용자 지정 폴백:
config.modelFallbackPolicy는 이전 구성과의 호환성을 위한 더 이상 사용되지 않는 필드로만 유지됩니다. 더 이상 런타임 동작을 변경하지 않습니다.
메모리 도구
기본적으로 Active Memory는 차단 회상 하위 에이전트가memory_search와 memory_get을 호출하도록 허용합니다. 이는 기본 제공 memory-core 계약과 일치합니다. plugins.slots.memory가 memory-lancedb를 선택하고 config.toolsAllow가 설정되지 않은 경우 Active Memory는 기존 LanceDB 동작을 유지하고 대신 memory_recall을 사용합니다.
다른 메모리 Plugin을 사용하는 경우 config.toolsAllow를 해당 Plugin이 등록하는 정확한 도구 이름으로 설정하세요. Active Memory는 회상 프롬프트에 해당 도구들을 나열하고 동일한 목록을 내장 하위 에이전트에 전달합니다. 구성된 도구 중 사용 가능한 것이 없거나 메모리 하위 에이전트가 실패하면 Active Memory는 해당 턴의 회상을 건너뛰고, 기본 응답은 메모리 컨텍스트 없이 계속됩니다. toolsAllow는 구체적인 메모리 도구 이름만 허용합니다. 와일드카드, group:* 항목, 그리고 read, exec, message, web_search 같은 핵심 에이전트 도구는 숨겨진 메모리 하위 에이전트가 시작되기 전에 무시됩니다.
기본 동작 참고: Active Memory는 더 이상 memory-core 기본 허용 목록에 memory_recall을 포함하지 않습니다. 기존 memory-lancedb 설정은 plugins.slots.memory가 memory-lancedb로 설정되어 있으면 계속 작동합니다. 명시적 toolsAllow는 항상 자동 기본값보다 우선합니다.
기본 제공 memory-core
기본 설정에는 명시적toolsAllow가 필요하지 않습니다.
LanceDB 메모리
번들로 제공되는memory-lancedb Plugin은 memory_recall을 노출합니다. 메모리 슬롯을 선택하는 것만으로 Active Memory가 해당 회상 도구를 사용하기에 충분합니다.
Lossless Claw
Lossless Claw는 자체 회상 도구를 가진 컨텍스트 엔진 Plugin입니다. 먼저 컨텍스트 엔진으로 설치하고 구성하세요. 컨텍스트 엔진을 참조하세요. 그런 다음 Active Memory가 Lossless Claw 회상 도구를 사용하도록 허용합니다.toolsAllow에 lcm_expand를 포함하지 마세요. Lossless Claw는 이를 더 낮은 수준의 위임된 확장 도구로 사용합니다.
고급 탈출구
이 옵션들은 의도적으로 권장 설정의 일부가 아닙니다.config.thinking은 차단 메모리 하위 에이전트의 사고 수준을 재정의할 수 있습니다.
config.promptAppend는 기본 Active Memory 프롬프트 뒤, 대화 컨텍스트 앞에 추가 운영자 지침을 더합니다.
toolsAllow와 함께 promptAppend를 사용하세요.
config.promptOverride는 기본 Active Memory 프롬프트를 대체합니다. OpenClaw는 여전히 그 뒤에 대화 컨텍스트를 추가합니다.
NONE 또는 간결한 사용자 사실 컨텍스트를 반환하도록 조정되어 있습니다.
트랜스크립트 유지
Active Memory 차단 메모리 하위 에이전트 실행은 차단 메모리 하위 에이전트 호출 중 실제session.jsonl 트랜스크립트를 생성합니다.
기본적으로 해당 트랜스크립트는 임시입니다.
- 임시 디렉터리에 기록됩니다
- 차단 메모리 하위 에이전트 실행에만 사용됩니다
- 실행이 끝나면 즉시 삭제됩니다
config.transcriptDir로 상대 하위 디렉터리를 변경할 수 있습니다.
주의해서 사용하세요.
- 차단 메모리 하위 에이전트 트랜스크립트는 바쁜 세션에서 빠르게 쌓일 수 있습니다
full쿼리 모드는 많은 대화 컨텍스트를 중복할 수 있습니다- 이 트랜스크립트에는 숨겨진 프롬프트 컨텍스트와 회상된 메모리가 포함됩니다
구성
모든 active memory 구성은 다음 아래에 있습니다.| 키 | 유형 | 의미 |
|---|---|---|
enabled | boolean | Plugin 자체를 활성화합니다 |
config.agents | string[] | Active Memory를 사용할 수 있는 에이전트 ID |
config.model | string | 선택 사항인 차단 메모리 하위 에이전트 모델 참조입니다. 설정하지 않으면 Active Memory는 현재 세션 모델을 사용합니다 |
config.allowedChatTypes | ("direct" | "group" | "channel")[] | Active Memory를 실행할 수 있는 세션 유형입니다. 기본값은 다이렉트 메시지 스타일 세션입니다 |
config.allowedChatIds | string[] | allowedChatTypes 이후에 적용되는 선택 사항인 대화별 허용 목록입니다. 비어 있지 않은 목록은 기본적으로 차단됩니다 |
config.deniedChatIds | string[] | 허용된 세션 유형과 허용된 ID보다 우선하는 선택 사항인 대화별 거부 목록입니다 |
config.queryMode | "message" | "recent" | "full" | 차단 메모리 하위 에이전트가 볼 수 있는 대화의 양을 제어합니다 |
config.promptStyle | "balanced" | "strict" | "contextual" | "recall-heavy" | "precision-heavy" | "preference-only" | 메모리를 반환할지 결정할 때 차단 메모리 하위 에이전트가 얼마나 적극적이거나 엄격한지 제어합니다 |
config.toolsAllow | string[] | 차단 메모리 하위 에이전트가 호출할 수 있는 구체적인 메모리 도구 이름입니다. 기본값은 ["memory_search", "memory_get"]이거나, plugins.slots.memory가 memory-lancedb일 때는 ["memory_recall"]입니다. 와일드카드, group:* 항목, 코어 에이전트 도구는 무시됩니다 |
config.thinking | "off" | "minimal" | "low" | "medium" | "high" | "xhigh" | "adaptive" | "max" | 차단 메모리 하위 에이전트에 대한 고급 사고 재정의입니다. 속도를 위해 기본값은 off입니다 |
config.promptOverride | string | 고급 전체 프롬프트 대체입니다. 일반적인 사용에는 권장되지 않습니다 |
config.promptAppend | string | 기본 프롬프트 또는 재정의된 프롬프트에 추가되는 고급 추가 지침입니다 |
config.timeoutMs | number | 차단 메모리 하위 에이전트의 엄격한 제한 시간이며, 120000 ms로 제한됩니다 |
config.setupGraceTimeoutMs | number | 회수 제한 시간이 만료되기 전의 고급 추가 설정 예산입니다. 기본값은 0이고 30000 ms로 제한됩니다. v2026.4.x 업그레이드 지침은 콜드 스타트 유예를 참조하세요 |
config.maxSummaryChars | number | Active Memory 요약에 허용되는 최대 총 문자 수 |
config.logging | boolean | 튜닝 중 Active Memory 로그를 내보냅니다 |
config.persistTranscripts | boolean | 임시 파일을 삭제하지 않고 차단 메모리 하위 에이전트 transcript를 디스크에 보관합니다 |
config.transcriptDir | string | 에이전트 세션 폴더 아래의 상대 차단 메모리 하위 에이전트 transcript 디렉터리 |
| 키 | 유형 | 의미 |
|---|---|---|
config.maxSummaryChars | number | Active Memory 요약에 허용되는 최대 총 문자 수 |
config.recentUserTurns | number | queryMode가 recent일 때 포함할 이전 사용자 턴 |
config.recentAssistantTurns | number | queryMode가 recent일 때 포함할 이전 assistant 턴 |
config.recentUserChars | number | 최근 사용자 턴당 최대 문자 수 |
config.recentAssistantChars | number | 최근 assistant 턴당 최대 문자 수 |
config.cacheTtlMs | number | 반복되는 동일 쿼리에 대한 캐시 재사용입니다(범위: 1000-120000 ms, 기본값: 15000). |
config.circuitBreakerMaxTimeouts | number | 동일한 에이전트/모델에서 이 횟수만큼 연속 제한 시간이 발생하면 회수를 건너뜁니다. 성공적인 회수 시 또는 쿨다운 만료 후 재설정됩니다(범위: 1-20, 기본값: 3). |
config.circuitBreakerCooldownMs | number | 회로 차단기가 작동한 뒤 회수를 건너뛸 시간(ms)입니다(범위: 5000-600000, 기본값: 60000). |
권장 설정
recent로 시작하세요.
/verbose on을 사용하고 Active Memory 디버그 요약에는
/trace on을 사용하세요. 채팅 채널에서는 이러한 진단 줄이 기본 assistant
응답 앞이 아니라 뒤에 전송됩니다.
그런 다음 다음으로 이동하세요.
- 더 낮은 지연 시간이 필요하면
message - 추가 컨텍스트가 더 느린 차단 메모리 하위 에이전트를 감수할 가치가 있다고 판단하면
full
콜드 스타트 유예
v2026.5.2 이전에는 Plugin이 콜드 스타트 중에 구성된timeoutMs를
추가 30000 ms만큼 조용히 확장하여 모델 워밍업, 임베딩 인덱스 로드,
첫 회수가 하나의 더 큰 예산을 공유할 수 있게 했습니다. v2026.5.2에서는
그 유예가 명시적인 setupGraceTimeoutMs 구성 뒤로 이동했습니다. 이제
사용자가 옵트인하지 않는 한 구성된 timeoutMs가 기본 예산입니다.
v2026.4.x에서 업그레이드했고 timeoutMs를 이전의 암시적 유예 환경에 맞게
조정한 값으로 설정했다면(권장 시작 값인 timeoutMs: 15000이 한 예입니다),
setupGraceTimeoutMs: 30000을 설정하여 프롬프트 빌드 훅과 외부 워치독
예산을 v5.2 이전의 유효 값으로 다시 확장하세요.
setupGraceTimeoutMs 구성 뒤로 이동하여 Plugin이 더 이상
메인 레인에서 15000 ms 구성을 45000 ms로 조용히 확장하지 않도록 합니다.”
임베디드 recall runner는 동일한 유효 제한 시간 예산을 사용하므로
setupGraceTimeoutMs는 외부 프롬프트 빌드 감시자와 내부의
차단형 recall 실행을 모두 포함합니다.
콜드 스타트 지연 시간이 알려진 절충점인, 리소스가 빠듯한 Gateway의 경우
더 낮은 값(5000~15000 ms)도 동작합니다. 다만 절충점은
Gateway 재시작 후 첫 번째 recall이 워밍업이 끝나기 전에 빈 결과를 반환할
가능성이 더 높아진다는 점입니다.
디버깅
Active Memory가 예상한 위치에 표시되지 않는 경우:- Plugin이
plugins.entries.active-memory.enabled에서 활성화되어 있는지 확인합니다. - 현재 에이전트 ID가
config.agents에 나열되어 있는지 확인합니다. - 대화형 영구 채팅 세션을 통해 테스트하고 있는지 확인합니다.
config.logging: true를 켜고 Gateway 로그를 확인합니다.openclaw memory status --deep로 메모리 검색 자체가 동작하는지 검증합니다.
maxSummaryChars
queryMode를 낮춥니다timeoutMs를 낮춥니다- 최근 턴 수를 줄입니다
- 턴별 문자 수 한도를 줄입니다
일반적인 문제
Active Memory는 구성된 메모리 Plugin의 recall 파이프라인을 사용하므로, 대부분의 recall 관련 예상 밖 동작은 Active Memory 버그가 아니라 임베딩 제공자 문제입니다. 기본memory-core 경로는 memory_search와 memory_get을 사용하고,
memory-lancedb 슬롯은 memory_recall을 사용합니다. 다른 메모리 Plugin을
사용하는 경우, config.toolsAllow가 해당 Plugin이 실제로 등록하는 도구의
이름을 지정하는지 확인합니다.
임베딩 제공자가 전환되었거나 동작을 멈춤
임베딩 제공자가 전환되었거나 동작을 멈춤
memorySearch.provider가 설정되어 있지 않으면 OpenClaw는 처음으로
사용 가능한 임베딩 제공자를 자동 감지합니다. 새 API 키, 할당량 소진, 또는
속도 제한이 걸린 호스팅형 제공자는 실행 간에 어떤 제공자가 해석되는지를
바꿀 수 있습니다. 제공자가 해석되지 않으면 memory_search가 어휘 기반
검색으로만 저하될 수 있습니다. 제공자가 이미 선택된 뒤의 런타임 실패는
자동으로 대체 제공자로 폴백되지 않습니다.선택을 결정적으로 만들려면 제공자(및 선택적 폴백)를 명시적으로 고정합니다.
전체 제공자 목록과 고정 예시는 메모리 검색을
참조하세요.Recall이 느리거나, 비어 있거나, 일관성이 없어 보임
Recall이 느리거나, 비어 있거나, 일관성이 없어 보임
- 세션에서 Plugin 소유 Active Memory 디버그 요약을 표시하려면
/trace on을 켭니다. - 각 응답 뒤에
🧩 Active Memory: ...상태 줄도 보려면/verbose on을 켭니다. - Gateway 로그에서
active-memory: ... start|done,memory sync failed (search-bootstrap), 또는 제공자 임베딩 오류를 확인합니다. - 메모리 검색 백엔드와 인덱스 상태를 검사하려면
openclaw memory status --deep를 실행합니다. ollama를 사용하는 경우 임베딩 모델이 설치되어 있는지 확인합니다 (ollama list).
Gateway 재시작 후 첫 번째 recall이 `status=timeout`을 반환함
Gateway 재시작 후 첫 번째 recall이 `status=timeout`을 반환함
v2026.5.2 이상에서는, 첫 번째 recall이 실행될 때까지 콜드 스타트 설정(모델 워밍업 및 임베딩
인덱스 로드)이 끝나지 않은 경우 실행이 구성된
timeoutMs 예산에 도달하여
빈 출력과 함께 status=timeout을 반환할 수 있습니다. Gateway 로그에는
재시작 후 첫 번째 적격 응답 근처에 active-memory timeout after Nms가 표시됩니다.권장 setupGraceTimeoutMs 값은 권장 설정 아래의
콜드 스타트 유예를 참조하세요.