A Microsoft Research apresenta o Memora, um framework escalável de memória agêntica projetado para equilibrar abstração e especificidade em tarefas de IA de longo prazo. O sistema desacopla o conteúdo rico da memória das estruturas leves de recuperação, estabelecendo novos resultados state-of-the-art em benchmarks enquanto utiliza até 98% menos tokens de contexto.

  • Memora desacopla o que é armazenado (conteúdo rico da memória) de como ele é recuperado (abstrações leves e âncoras de dica).
  • Cada entrada de memória consiste em uma abstração primária (6–8 palavras) para busca baseada em embeddings e um valor de memória que contém os detalhes completos.
  • As âncoras de dica fornecem tags flexíveis e conscientes do contexto como caminhos alternativos de acesso às memórias, sem ontologias rígidas.
  • O sistema supera Mem0, RAG e inferência de contexto completo nos benchmarks LoCoMo e LongMemEval.

Esta abordagem resolve o trade-off entre preservar detalhes finos e organizar a memória eficientemente, permitindo que os agentes naveguem por seu histórico sem reler conversas inteiras.