OpenClaw 기억 상실과 비용 폭탄의 원인: 99% 가 Memory 를 잘못 쓰고 있습니다 (자동 스킬 포함)
OpenClaw 사용자의 90% 가 다음과 같은 문제에 직면해 있습니다:
- 수익을 내기도 전에 토큰 비용 때문에 파산 위기.
- 월간 구독을 했음에도 플랫폼 속도 제한에 걸림.
- Memory 설정을 아무리折腾해도 '랍스터 (OpenClaw)'는 여전히 기억 상실 증상.
- Memory 혼란으로 관리 난이도 상승.
- QMD 검색 시스템을 썼는데도 토큰 감소 효과가 없음.
이런 상황이 몇 번 반복되면 누가 랍스터를 키울 마음이 있겠습니까?
많은 사람들의 첫 반응은 이렇습니다:
- 모델이 충분히 강력하지 않다.
- 컨텍스트 창이 너무 작다.
- 도구가 불안정하다.
저는 3 일 동안 OpenClaw 와 모델 간 상호작용 메커니즘을 완전히 분석하여, 기억 상실과 토큰 소모의 진정한 원인을 찾아냈습니다!
진짜 문제는 바로 Memory 를 잘못 작성했다는 것입니다.
이 글에서는 '기억 상실 없음, 토큰 안정화, QMD 를 통한 실질적인 비용 절감'이 가능한 '자동화 실행 Memory 구조'를 소개합니다.
결과부터 말씀드리면:
제 OpenClaw 는 더 이상 기억 상실을 하지 않으며, 토큰 소비량이 88% 급감했습니다.
비용 절감 효과 시뮬레이션
프로젝트 대화 기록이 누적되어 50,000 토큰이라고 가정해 봅시다:
- 전체 기록 모드: 라운드당 50,000 토큰 소모 → 10 회 실행 시 500,000 토큰.
- QMD 검색 모드: 즉시 창 5,000 + 검색召回 (리콜) 1,000 = 라운드당 6,000 토큰 → 10 회 실행 시 60,000 토큰.
(과거 대화 전체를 넣는 대신 상위 3~5 개片段만召回) 이로써 88% 절약됩니다. 보수적으로 75% 절약이라고 계산해도 4 배나 아낄 수 있습니다.
대화가 길어질수록优势는 커집니다. 10 회 대화시 88%, 100 회 대화시 95% 이상 절약 가능합니다. 전체 모드는 나중에 한계를 돌파하지만, QMD 모드는 항상 8-10k 수준을 유지합니다.
파트 1: OpenClaw 가 기억을 잃고 비용을 태우는 이유
99% 의 사용자가 Memory 를 잘못 사용하고 있기 때문에 OpenClaw 는 기억 상실을 겪고 비용을 낭비합니다!
흔한 오해
"모든 내용을 MEMORY 에 쌓아두면 된다" → 이는臃肿 (비만) 하고 기억 상실을 유발합니다.
최근 제 OpenClaw运行机制을 분석한 핵심 결론은 다음과 같습니다:
더 이상 '페르소나, 사용자 프로필, 스킬 디렉토리, 실행 규칙, 일상 로그'를 하나의 MEMORY 파일에 모두 넣지 마십시오.
지식을 '먹이는' 것처럼 보이지만, 실제로는 노이즈 (잡음)를 만들고 있는 것입니다.
파트 2: 랍스터 키우기의 핵심은 설정 문서 관리
1. 설정 파일을 올바르게 작성해야 모델이 기억을 잃지 않습니다
오류 수정: OpenClaw 는 '단일 기억체'가 아니라 계층적 시스템입니다.
OpenClaw 와 모델의 상호작용 메커니즘은 8 층 운영체제와 유사합니다. 명령을 내리면 OpenClaw 는 다음과 같은 구조를 모델에 전송합니다:
| 계층 | 내용 및 역할 |
|---|---|
| 시스템 규칙층 (System-owned) | 도구 권한, 보안 경계, 호출 규칙, 응답 형식 등 |
| 런타임 주입층 (System-owned) | 현재 작업 목표, 환경 변수, 실행 상태 (시스템이 임시 주입) |
| 세션 컨텍스트층 (Thread history) | 현재 채팅 및 스레드 기록 |
| 페르소나층 | SOUL.md |
| 사용자 프로필층 | USER.md |
| 장기 기억층 | MEMORY.md (고가치, 저노이즈) |
| 일상 이벤트층 | memory/YYYY-MM-DD.md |
| 실행 규칙층 | TOOLS.md (하드 룰) |
유지 관리 가능한 핵심 파일 및 작성 가이드 (중요)
- SOUL.md (페르소나 원칙): 스타일, 원칙, 경계, 작업 방식 작성. (프로젝트 세부사항, 임시 작업, 도구 파라미터 금지)
- USER.md (사용자 프로필): 장기 목표, 소통 선호도, 작문 규칙 작성. (일일 로그, 일회성 이벤트 금지)
- MEMORY.md (장기 고가치 기억): 장기 유효한 선호도/결정/안정된 규칙 작성. (스킬 디렉토리, 긴 로그, 임시 토론 금지)
- memory/YYYY-MM-DD.md (일상 로그): 당일 발생 사항, 결정 사항, 할 일 작성. (더러워져도 괜찮지만, DECISION/PREF/TODO 태그로 구조화 필수)
- TOOLS.md (실행 하드 룰): 경로, 기본 프로필, 스킬 라우팅 트리거 규칙 등 작성. (가치관, 긴 설명 금지)
- AGENTS.md (프로세스 거버넌스): 기억 유지 방법, 위험 동작 확인 시기 등 거버넌스 제도 작성. (반복 실행 파라미터 금지)
모델 상호작용 메커니즘을 이해하면, 모델이 가장 먼저 해당 파일에서 관련 규칙을 찾지 MEMORY 에서 찾지 않는다는 것을 알 수 있습니다. 모든 내용을 MEMORY 에 넣으면 모델은 반드시 기억 상실을 일으킵니다!
그렇다면 새로운 문제가 발생합니다. 6 개의 유지 관리 파일 중 일상 기억이 매일 기록되고 업데이트되면 파일이 점점 커져 결국 많은 토큰을 소모하게 됩니다.
파트 3: 토큰 소모를 최소화하는 방법
어떻게 비용 절감과 사용자 경험의 최적 균형을 맞출 수 있을까요?
토큰 소모의 3 가지 층위
- 설정 파일: 현재 최적화의 핵심 (기억 파일 포함).
- 대화: 의도적으로 압축 관리하지 말고, 주제별로 세션을 분리하여 컨텍스트 공간 극대화.
- 첨부 파일: 의도적으로 압축 관리하지 말고 효율적인 경험 우선.
최상의 경험을 위해 대화와 첨부 파일은 의도적으로 압축하지 마십시오. AI 를 사용하는目的就是 효율성과 쾌적함입니다. 이 부분은 필요한 만큼 소모하여 더 나은 경험을 얻으세요.
설정 파일의 최소화가 토큰 절감의 최우선 과제입니다.
예를 들어, 모델 컨텍스트가 272k 라면 최적화된 설정 파일은 8-10k 로 제어해야 합니다 (약 4%). 나머지 공간은 대화와 첨부 파일에 할당하여 더 나은 대화 환경을 조성합니다.
컨텍스트 효율적 활용을 위한 4 가지 사항
- 설정 파일 크기 8-10k 유지 (OpenClaw 8 층 운영체제 포함).
- 설정 파일 기록 내용은 짧을수록 좋고, 삭제 가능한 것은 삭제.
- 주제별 대화 세션 분리: 메인 대화, 시스템 운영, 자산 관리 등 분산하여 효율적 활용.
- QMD 검색 시스템 도입: 일상 기억/Obsidian 노트库를 계층적으로 읽도록 하여 점진적 정보 공개, 토큰 효율 향상.
이를 수동으로 관리하는 것은 매우 힘들고 지속 불가능합니다! 걱정하지 마십시오. 저는 이 관리 시스템을 스킬로 만들어 두었습니다. 원클릭 설치로 OpenClaw 가 자동으로 학습하고 사용하도록 할 수 있습니다.
Memory + QMD的正确 구조, 기억 파일 압축 효율화!
설정 파일 중 가장 큰 파일은 기억 파일이므로, QMD 검색 시스템을 도입하여 기억 파일의 구조와 읽기 방식을 최적화해야 합니다.
"QMD 시스템을 썼는데도 토큰이 절약되지 않는다?"
OpenClaw 의 기억 시스템 읽기 링크를 정리해 봅시다:
- 핵심 기억 Memory.md: 먼저 읽음 (가장 중요한 내용 및 1 차 인덱스 키워드).
- QMD 인덱스 시스템: Memory 의 키워드가 트리거되면 모델이 QMD 인덱스를 읽고 2 차 키워드 트리거.
- 일상 기억/노트库 등 로컬 문서: 키워드片段读取, 인식 후 출력.
대화를 시작하기도 전에 컨텍스트가 가득 차는 것을 원하지 않는다면, 핵심 기억인 Memory 문서에는 엄격한 기준을 유지해야 합니다.
- '입고 기준' 설정: 다음 조건 중 최소 2 가지를 만족해야만 MEMORY 에 진입 가능.
- 미래 결정에 영향 (>2 주)
- 반복 사용됨 (프로세스/선호도/규칙)
- 잊으면 명확한 손실 발생 (실수 방지)
- 실행 가능하고 검증 가능 (감정적 느낌 제외)
- METORY 에 넣어야 할 3 가지 QMD 정보:
- 인덱스 진입점 (collection/path/mask)
- 검색 프로토콜 (정확한 제목 → 키워드 → 의미론적)
- 고가치 앵커 단어 (최대 20-40 개, 전체 어휘库 아님)
- 넣지 말아야 할 것: 긴 키워드 목록, 전문 요약, 과거 로그.
추천 구조 (실행 가능)
METORY 에 매우 짧은 섹션을 추가합니다:
• QMD collection: [자신의 이름]_memory • source path: /Users/xxxx/[자신의 이름]_memory • search priority: title exact > keyword > semantic • hot anchors: LifeOS, MarkWave, Asset, OpenClaw, Skill Routing ... (상한선 통제)
그리고 실제 키워드库는 독립 파일 (docs/qmd-keywords.md 또는 QMD 내부 인덱스 메타데이터) 에 저장하여 METORY 에 넣지 않도록 합니다.
QMD 히트 후 계층적 압축 주입:
- 후보 반환 (제목/경로/관련도).
- 상위 k 개만 추출 (보통 3~5 개).
- 각 항목당 관련片段만 추출 (예: 5~20 줄).
- 요약/중복 제거 후 모델에 주입.
OpenClaw 가 기억 상실을 하지 않고 비용을 태우지 않으려면 다음을 해결해야 합니다:
- Memory: 어디서 찾을지 결정.
- QMD: 무엇을 찾을지 결정.
- 모델: 읽기 및 표현 담당.
파트 4: 원클릭 설정 완전 자동화 유지 관리 시스템
4 단계 QMD 시스템 설정, 토큰 절감의 열쇠
1. 원클릭 Memory 규칙 스킬 설정 (시간과 노력 절약)
这么多 설정 파일을 매번 수동으로 하나씩 업데이트하는 것은 AI 사용의 효율성 취지에 어긋납니다. 저는 'Memory Sync Protocol'이라는 스킬을 작성했습니다.
핵심 기억에 기록할 때마다 여러 파일을 동기화하여 수동 설정의 복잡성을 줄입니다.
새로운 선호도/규칙이 있을 때 통일되게 실행:
TOOLS: 실행 세부사항 기록.MEMORY: 고수준 선호도 기록.AGENTS: 거버넌스 전략 기록 (필요시).daily memory: 변경 로그 기록.git commit: 롤백 가능한 버전 유지.
2. 원클릭 자동화 검토 메커니즘 설정 (인간 관리 난이도 감소)
동시에 자동화 자체 검토 메커니즘을 구현하여 문제 발생 시 즉시 오류를 보고 알림을 줍니다.
이 검토 스킬은 두 가지 중요한 작업을 수행합니다:
1) Memory 작성 원칙 검토 (표준 통일)
- 단일 책임: 각 파일은 한 가지 일만 수행 (各司其职).
- 최소 필요: 짧을수록 좋고, 삭제 가능한 것은 삭제.
- 실행 가능: '규칙 문장' 작성, 공허한 설명 금지.
- 검증 가능: 중요 규칙은 확인 가능해야 함 (경로/명령/트리거 단어).
- 만료 가능: 각 주요 규칙은 만료 조건 또는 재검토 주기 보유.
2) 주기적 자동화 검토
- 모델에 전송되는 다층 핵심 파일 크기를 8-10k 로 제어.
- Memory 인덱스 키워드를 20-40 개로 유지.
- Memory 언급 임계값: 3KB 초과 시 정리 알림.
- 주간 보고서 요약 업데이트: 어떤 것을 업데이트하고 삭제할지 사용자가 결정 (유효 단어 3 개 추가 시 저조도 단어 3 개 삭제).
- 히트 통계: 최근 1 주일 query 결과를 바탕으로 앵커 횟수 업데이트 (데이터 기반).
위 조건에 따라 매주 주간 보고서를 발송하며, 데이터가 초과될 경우 즉시 피드백을 보고합니다.
지식库에서 스킬 파일을 다운로드하여 OpenClaw 에게 직접 보내 설치하게 하십시오. 이는 "채팅으로 OpenClaw 에게 기억하게 하는 것"보다 훨씬 신뢰할 수 있습니다.
이번 개선과 진화로 인한 3 가지 향상
- Memory 규칙이 더욱 명확해져, 단 한 문장으로 OpenClaw 에게 무언가를 기억시킬 수 있게 됨.
- 기억 파일/Obsidian 노트库 인덱스 구조가 명확해져, 모델이 점진적으로 읽으므로 토큰 대폭 절감.
- OpenClaw 메커니즘에 맞춰 설정 파일을 업데이트 최적화하므로, 모델이 더 정확하게 읽어서 기억 상실이 사라짐.
이는 '더 당신을 잘 이해함 + 더 안정적인 실행 + 더 많은 토큰 절감'을 의미합니다. 이제 랍스터가 완성되었습니다.
당신은 '더 똑똑한 모델'이 필요한 것이 아닙니다.
필요한 것은 '더 명확한 기억 구조와 실행 규율'입니다.
이 시스템이 가동되면 OpenClaw 는 단순한 '채팅 도우미'에서 '장기 팀원'으로 변모할 것입니다.