MemPalace: LongMemEval 벤치마크 96.6%를 달성한 로컬 우선 AI 메모리 시스템

MemPalace 소개

AI 어시스턴트와의 대화가 길어질수록, 어시스턴트가 이전 맥락을 기억하지 못하는 문제에 부딪힌 경험이 있을 것입니다. 많은 AI 메모리 시스템들이 이 문제를 해결하려 시도하지만, 대화를 요약(summarization)하는 과정에서 중요한 세부 정보가 손실되는 경우가 잦습니다. MemPalace는 이 근본적인 문제를 다른 방향으로 접근합니다.

MemPalace는 요약 대신 대화 전문(verbatim)을 그대로 저장하고, 이를 고대의 기억술인 기억의 궁전(memory palace) 기법에서 영감을 받은 계층적 구조로 조직화하여 높은 검색 정확도를 달성합니다. 2026년 4월 기준 LongMemEval 벤치마크에서 R@5 96.6%를 기록하여 공개된 AI 메모리 시스템 중 최고 점수를 달성했습니다.

MemPalace의 핵심 설계 철학은 "모든 것을 저장하고, 그것을 찾을 수 있게 만든다(Store everything, then make it findable)"입니다. ChromaDB를 벡터 데이터베이스로 활용하여 대화 전체를 의미 검색(semantic search)이 가능한 형태로 저장합니다. 22,000개 이상의 실제 대화를 대상으로 한 테스트에서, 날개(wing)와 방(room) 필터링을 통한 검색이 구조화되지 않은 검색 대비 R@10 기준 60.9%에서 94.8%로 34포인트 향상을 보였습니다.

MemPalace의 기억의 궁전 아키텍처

MemPalace의 가장 독특한 특징은 계층적 메모리 구조입니다. 고대 그리스와 로마 시대의 기억술사들이 기억해야 할 정보를 상상 속의 장소에 배치했듯, MemPalace는 대화와 지식을 건축학적 은유를 통해 체계적으로 조직화합니다.

  ┌─────────────────────────────────────────────────────────────┐
  │  WING: Person                                              │
  │                                                            │
  │    ┌──────────┐  ──hall──  ┌──────────┐                    │
  │    │  Room A  │            │  Room B  │                    │
  │    └────┬─────┘            └──────────┘                    │
  │         │                                                  │
  │         ▼                                                  │
  │    ┌──────────┐      ┌──────────┐                          │
  │    │  Closet  │ ───▶ │  Drawer  │                          │
  │    └──────────┘      └──────────┘                          │
  └─────────┼──────────────────────────────────────────────────┘
            │
          tunnel
            │
  ┌─────────┼──────────────────────────────────────────────────┐
  │  WING: Project                                             │
  │         │                                                  │
  │    ┌────┴─────┐  ──hall──  ┌──────────┐                    │
  │    │  Room A  │            │  Room C  │                    │
  │    └────┬─────┘            └──────────┘                    │
  │         │                                                  │
  │         ▼                                                  │
  │    ┌──────────┐      ┌──────────┐                          │
  │    │  Closet  │ ───▶ │  Drawer  │                          │
  │    └──────────┘      └──────────┘                          │
  └─────────────────────────────────────────────────────────────┘

전체 구조는 다음과 같이 구성됩니다:

  • 날개(Wings): 프로젝트 또는 사람에 대응 (예: wing_orion, wing_driftwood)
  • 방(Rooms): 날개 내의 특정 주제 (인증, 결제, 배포 등)
  • 복도(Halls): 모든 날개에 걸쳐 존재하는 메모리 유형 (사실, 사건, 발견, 선호도, 조언)
  • 옷장(Closets): 원본 콘텐츠를 가리키는 요약본
  • 서랍(Drawers): 실제 원본 파일
  • 터널(Tunnels): 서로 다른 날개에 걸쳐 동일한 주제를 연결하는 교차 참조

이러한 구조 덕분에 "Clerk을 사용하기로 결정한 사람이 누구였나요?"와 같은 쿼리에 대해 단순한 키워드 매칭이 아닌 맥락이 풍부한 검색 결과를 제공할 수 있습니다. SQLite 기반의 지식 그래프(Knowledge Graph)는 시간적 유효성 창(temporal validity windows)이 있는 엔티티-관계 트리플(entity-relationship triple)을 저장하여 "지난 1월에는 무엇이 사실이었나요?"와 같은 시간 인식 쿼리도 지원합니다.

MemPalace 설치 및 사용법

Python 3.9 이상이 필요하며, 완전히 로컬에서 동작하므로 API 키나 클라우드 비용이 발생하지 않습니다.

pip install mempalace

# 프로젝트 초기화
mempalace init ~/projects/myapp

# 대화/문서 마이닝
mempalace mine ~/projects/myapp

# 메모리 검색
mempalace search "query text"

MCP 통합

Claude Code, ChatGPT, Cursor, Gemini 등 MCP(Model Context Protocol) 호환 도구와 통합할 수 있습니다. 19개의 도구를 제공하며, 메모리 검색, 지식 그래프 쿼리, 에이전트 관리 등의 기능을 포함합니다.

claude mcp add mempalace -- python -m mempalace.mcp_server

세 가지 마이닝 모드

MemPalace는 세 가지 컨텍스트 마이닝 모드를 지원합니다. 프로젝트 모드(Projects)는 코드와 문서에서 정보를 추출하고, 대화 모드(Conversations)는 Claude, ChatGPT, Slack 내보내기 파일을 처리합니다. 일반 모드(General)는 콘텐츠를 자동으로 결정(decision), 마일스톤(milestone), 문제(problem) 등으로 분류합니다. mempalace wake-up 명령을 통해 약 170토큰 분량의 핵심 사실을 컨텍스트에 로드하거나, CLI/Python API를 통해 온디맨드로 쿼리할 수 있습니다.

MemPalace 벤치마크 결과

모드 LongMemEval R@5 비고
원문 보존 모드 (Raw Verbatim) 96.6% 공개 결과 중 최고
AAAK 압축 모드 84.2% 토큰 효율성 실험적 기능

96.6% 점수는 500개 질문에 대해 독립 재현한 결과이며, 원문 보존 모드에서 22,000개 이상의 실제 대화 메모리를 대상으로 측정했습니다. AAAK(Abbreviation and Abstraction Key) 방언은 반복 등장하는 엔티티에 코드를 할당하여 토큰 효율성을 높이는 실험적 기능입니다. 현재는 원문 모드보다 성능이 낮지만(84.2%), 메모리 스케일이 커질수록 이점이 있을 것으로 기대됩니다.

개발팀은 2026년 4월 최초 발표 시 일부 주장이 과장되었음을 솔직하게 인정했습니다. AAAK 토큰 절감 예시는 잘못된 휴리스틱을 사용했고, "+34% 팰리스 부스트"는 평탄한 비구조 검색이 아닌 표준 메타데이터 필터링과 비교한 결과입니다. 이러한 투명한 정정은 오히려 프로젝트의 신뢰성을 높이는 요소로 평가받고 있습니다.

라이선스

MemPalace는 MIT 라이선스로 공개되어 있어 개인 및 상업적 목적으로 자유롭게 사용할 수 있습니다.

:github: MemPalace 프로젝트 GitHub 저장소

더 읽어보기




이 글은 GPT 모델로 정리한 글을 바탕으로 한 것으로, 원문의 내용 또는 의도와 다르게 정리된 내용이 있을 수 있습니다. 관심있는 내용이시라면 원문도 함께 참고해주세요! 읽으시면서 어색하거나 잘못된 내용을 발견하시면 덧글로 알려주시기를 부탁드립니다. :hugs:

:pytorch:파이토치 한국 사용자 모임:south_korea:이 정리한 이 글이 유용하셨나요? 회원으로 가입하시면 주요 글들을 이메일:love_letter:로 보내드립니다! (기본은 Weekly지만 Daily로 변경도 가능합니다.)

:wrapped_gift: 아래:down_right_arrow:쪽에 좋아요:+1:를 눌러주시면 새로운 소식들을 정리하고 공유하는데 힘이 됩니다~ :star_struck:

무려 밀라요보비치의 공식 깃헙입니다 :+1:

1개의 좋아요

헛.... 저는 유명한 분의 팬이신가 했는데, 레지던트 이블의 주인공 역할 본인이시군요 :open_mouth:

찾아보니 공식 홈페이지에는 업데이트가 안 되어 있는 것 같긴 한데


관련한 뉴스들이나 글들이 있는 것을 보면 사실인가보네요.

https://cybernews.com/ai-news/milla-jovovich-mempalace-memory-tool/


우와.. 놀랍네요. @d9ng 님, 알려주셔서 감사합니다!