Pesquisadores apresentam o AutoMem, um framework que trata o gerenciamento de memória em grandes modelos de linguagem como uma habilidade treinável, em vez de um componente estático. O sistema eleva as operações do sistema de arquivos a ações de memória de primeira classe, permitindo que o modelo decida autonomamente como codificar, recuperar e organizar o conhecimento.
- O AutoMem automatiza dois eixos de melhoria: a estrutura da memória (prompts, esquemas, vocabulário) e a proficiência do modelo em usá-la.
- Um LLM forte revisa as trajetórias do agente para revisar iterativamente a estrutura da memória, enquanto as decisões bem-sucedidas do agente servem como sinais de treinamento para aprimorar a proficiência.
- Testes em jogos de horizonte longo gerados proceduralmente Crafter, MiniHack e NetHack mostraram que otimizar apenas a memória melhorou o desempenho base do agente em 2x-4x.
- Esta abordagem levou um modelo open-weight de 32B a ser competitivo com sistemas de ponta como Claude Opus 4.5 e Gemini 3.1 Pro Thinking sem modificar o comportamento tarefa-ação.
Os resultados demonstram que o gerenciamento de memória é uma habilidade aprendível independentemente e um objetivo de alta alavancagem para alcançar ganhos significativos em tarefas de horizonte longo.