A Microsoft Research apresenta o Memora, um framework escalável de memória agêntica projetado para equilibrar abstração e especificidade em tarefas de IA de longo prazo. O sistema desacopla o conteúdo rico da memória das estruturas leves de recuperação, estabelecendo novos resultados state-of-the-art em benchmarks enquanto utiliza até 98% menos tokens de contexto.
- Memora desacopla o que é armazenado (conteúdo rico da memória) de como ele é recuperado (abstrações leves e âncoras de dica).
- Cada entrada de memória consiste em uma abstração primária (6–8 palavras) para busca baseada em embeddings e um valor de memória que contém os detalhes completos.
- As âncoras de dica fornecem tags flexíveis e conscientes do contexto como caminhos alternativos de acesso às memórias, sem ontologias rígidas.
- O sistema supera Mem0, RAG e inferência de contexto completo nos benchmarks LoCoMo e LongMemEval.
Esta abordagem resolve o trade-off entre preservar detalhes finos e organizar a memória eficientemente, permitindo que os agentes naveguem por seu histórico sem reler conversas inteiras.