Microsoft Research는 장기 AI 작업에서 추상화와 구체성의 균형을 맞추도록 설계된 확장 가능한 에이전트 메모리 프레임워크인 Memora를 소개합니다. 이 시스템은 풍부한 메모리 내용을 경량 검색 구조와 분리하여, 컨텍스트 토큰을 최대 98%까지 줄이면서 벤치마크에서 새로운 최첨단 결과를 달성했습니다.
- Memora는 저장되는 내용(풍부한 메모리 콘텐츠)과 검색 방식(경량 추상화 및 큐 앵커)을 분리합니다.
- 각 메모리 항목은 임베딩 기반 검색을 위한 주요 추상화(6~8단어)와 전체 세부 정보를 담고 있는 메모리 값으로 구성됩니다.
- 큐 앵커는 경직된 오토로지를 사용하지 않고도 메모리에 접근할 수 있는 유연하고 컨텍스트 인식형 태그를 제공합니다.
- 이 시스템은 LoCoMo 및 LongMemEval 벤치마크에서 Mem0, RAG, 전체 컨텍스트 추론보다 우수한 성능을 보입니다.
이 접근 방식은 세밀한 세부 정보를 보존하는 것과 메모리를 효율적으로 조직화하는 것 사이의 균형을 해결하여, 에이전트가 전체 대화를 다시 읽지 않고도 자신의 과거를 탐색할 수 있도록 합니다.