연구자들은 AutoMem을 소개했습니다. 이는 대규모 언어 모델에서 메모리 관리를 정적 구성 요소가 아닌 훈련 가능한 기술로 취급하는 프레임워크입니다. 이 시스템은 파일 시스템 작업을 제1급 메모리 작업으로 승격시켜 모델이 지식을 인코딩, 검색 및 조직하는 방법을 자율적으로 결정할 수 있도록 합니다.

  • AutoMem은 두 가지 개선 축을 자동화합니다: 메모리 구조(프롬프트, 스키마, 어휘)와 이를 사용하는 모델의 숙련도.
  • 강력한 LLM은 에이전트의 궤적을 검토하여 메모리 구조를 반복적으로 수정하며, 에이전트의 성공적인 결정은 숙련도를 연마하기 위한 훈련 신호로 작용합니다.
  • 절차적으로 생성된 장기 호라이즌 게임인 Crafter, MiniHack, NetHack에서의 테스트는 메모리만 최적화해도 기본 에이전트 성능이 2배에서 4배 향상되었음을 보여주었습니다.
  • 이 접근 방식은 작업-액션 동작을 수정하지 않고도 32B 오픈 가중치 모델을 Claude Opus 4.5 및 Gemini 3.1 Pro Thinking과 같은 최첨단 시스템과 경쟁 가능한 수준으로 끌어올렸습니다.

이 결과는 메모리 관리가 독립적으로 학습 가능한 기술이며 장기 호라이즌 작업에서 상당한 향상을 달성하기 위한 높은 레버리지 목표임을 보여줍니다.