Los investigadores presentan AutoMem, un marco que trata la gestión de memoria en modelos de lenguaje grandes como una habilidad entrenable en lugar de un componente estático. El sistema eleva las operaciones del sistema de archivos a acciones de memoria de primera clase, permitiendo que el modelo decida autónomamente cómo codificar, recuperar y organizar el conocimiento.

  • AutoMem automatiza dos ejes de mejora: la estructura de la memoria (prompts, esquemas, vocabulario) y la competencia del modelo para usarla.
  • Un LLM fuerte revisa las trayectorias del agente para revisar iterativamente la estructura de la memoria, mientras que las decisiones exitosas del agente sirven como señales de entrenamiento para afilar la competencia.
  • Las pruebas en juegos de horizonte largo generados proceduralmente Crafter, MiniHack y NetHack mostraron que optimizar solo la memoria mejoró el rendimiento base del agente entre 2x y 4x.
  • Este enfoque llevó a un modelo abierto de 32B a ser competitivo con sistemas de vanguardia como Claude Opus 4.5 y Gemini 3.1 Pro Thinking sin modificar el comportamiento tarea-acción.

Los resultados demuestran que la gestión de memoria es una habilidad aprendible independientemente y un objetivo de alta palanca para lograr ganancias significativas en tareas de horizonte largo.