에이전트 메모리는 더 이상 보조적 기능이 아니다. 기초 모델 기반 인공지능 에이전트가 장기적 과업을 수행하고 환경에 적응하며 정체성을 유지하기 위해 반드시 갖춰야 할 핵심 인지 인프라로 부상했다. 그러나 2024~2025년을 전후해 관련 연구가 폭발적으로 증가하면서, ‘agent memory’라는 용어는 LLM memory, RAG, context engineering 등과 혼용되며 개념적 혼란을 심화시켜 왔다.
이 논문은 이러한 혼란의 원인을 기존 분류 체계의 한계에서 찾는다. 장기·단기 기억이라는 고전적 구분은 현대 에이전트 시스템의 구현 방식과 활용 목적을 설명하기에 부족하다. 연구자들은 메모리의 형태, 기능, 시간적 동작 중 일부만을 강조해 왔고, 그 결과 연구 전반이 파편화됐다.
이를 해결하기 위해 논문은 Forms–Functions–Dynamics(FFD) 삼각 프레임워크에 기반한 통합 분류 체계를 제안한다. 먼저 형태(Form)는 “무엇이 메모리를 담는가”에 주목한다. 토큰 수준 메모리는 외부 저장소에 텍스트나 구조화된 토큰을 누적하는 방식이며, 매개변수 메모리는 학습을 통해 모델 가중치에 지식을 내재화한다. 잠재 메모리는 명시적 텍스트가 아닌 임베딩이나 잠재 상태 공간에서 기억을 유지한다.
기능(Function)은 “왜 메모리가 필요한가”를 묻는다. 사실적 기억은 지식과 사실의 보존을, 경험적 기억은 과거 행동과 결과를 통한 학습을, 작업 기억은 추론 과정 중 일시적으로 유지되는 정보를 담당한다. 이 구분은 에이전트가 지식을 저장하는 것과 경험을 통해 변화하는 과정을 명확히 가른다.
동작(Dynamics)은 “메모리가 어떻게 진화하는가”에 초점을 맞춘다. 기억은 형성(formulation)되고, 검색(retrieval)되며, 시간에 따라 갱신·압축·내재화(evolution)된다. 논문은 특히 검색 과정이 성능의 병목이자 위험 요소임을 지적한다. 자율적 검색은 계산 효율을 높이지만, 실패할 경우 오류가 외부로 드러나지 않는 ‘조용한 환각’을 유발할 수 있기 때문이다. 따라서 검색은 정확성, 시점, 노이즈 제어 간의 균형 문제로 다뤄져야 한다고 강조한다.
주요 통찰 중 하나는 agent memory, RAG, context engineering의 명확한 구분이다. 컨텍스트 엔지니어링은 순간적인 입력 최적화에 가깝고, RAG는 외부 지식 접근을 보조하는 기술이다. 반면 에이전트 메모리는 지속적·누적적·진화적인 인지 상태로, 에이전트의 학습과 적응을 가능하게 한다.
또 다른 중요한 관찰은 토큰 수준 메모리 구조의 진화다. 초기의 단순한 1차원 텍스트 누적 방식에서, 2차원 평면 구조를 거쳐 그래프·트리·피라미드 형태의 3차원 계층 구조로 발전하고 있다. 이는 에이전트가 단순 저장을 넘어 관계와 추상화를 다루기 시작했음을 보여준다.
논문은 이론적 정리에 그치지 않고, 메모리 벤치마크와 오픈 소스 프레임워크를 정리하며 실질적 개발을 지원한다. 더 나아가 메모리 자동화, 강화학습과의 결합, 멀티모달·멀티에이전트 메모리, 신뢰성 문제 등 향후 연구 방향을 제시한다.
결론적으로 이 연구는 에이전트 메모리를 ‘긴 컨텍스트 처리 기법’이 아닌, 학습·적응·정체성을 지탱하는 핵심 인프라로 재정의한다. FFD 프레임워크는 분산된 연구들을 하나의 좌표계로 정렬하는 개념적 토대를 제공하며, 향후 에이전트 지능 설계에서 기억을 중심 요소로 재고해야 할 필요성을 분명히 한다.