Les chercheurs présentent AutoMem, un cadre qui traite la gestion de la mémoire dans les grands modèles de langage comme une compétence entraînable plutôt que comme un composant statique. Le système élève les opérations de système de fichiers au rang d'actions de mémoire de premier ordre, permettant au modèle de décider autonomement comment encoder, récupérer et organiser les connaissances.

  • AutoMem automatise deux axes d'amélioration : la structure de la mémoire (invites, schémas, vocabulaire) et la maîtrise du modèle pour l'utiliser.
  • Un LLM puissant examine les trajectoires des agents pour réviser itérativement la structure de la mémoire, tandis que les décisions réussies de l'agent servent de signaux d'entraînement pour affiner la maîtrise.
  • Les tests sur des jeux à horizon long générés procéduralement Crafter, MiniHack et NetHack ont montré qu'optimiser uniquement la mémoire améliorait les performances de base de l'agent par un facteur de 2x à 4x.
  • Cette approche a rendu un modèle open-weight de 32B compétitif avec des systèmes de pointe comme Claude Opus 4.5 et Gemini 3.1 Pro Thinking sans modifier le comportement action-tâche.

Les résultats démontrent que la gestion de la mémoire est une compétence apprenable indépendamment et un objectif à fort levier pour obtenir des gains significatifs dans les tâches à long horizon.