Исследователи представляют AutoMem, фреймворк, который рассматривает управление памятью в больших языковых моделях как обучаемый навык, а не статичный компонент. Система возвышает операции файловой системы до уровня первоклассных действий памяти, позволяя модели автономно решать, как кодировать, извлекать и организовывать знания.

  • AutoMem автоматизирует две оси улучшения: структуру памяти (промпты, схемы, словарь) и мастерство модели в её использовании.
  • Сильная LLM анализирует траектории агента для итеративного пересмотра структуры памяти, а успешные решения агента служат обучающими сигналами для повышения мастерства.
  • Тестирование на процедурно сгенерированных долгогоризонтных играх Crafter, MiniHack и NetHack показало, что оптимизация только памяти улучшила базовую производительность агента в 2–4 раза.
  • Этот подход вывел открытую модель весом 32B на уровень конкурентоспособности с передовыми системами, такими как Claude Opus 4.5 и Gemini 3.1 Pro Thinking, без изменения поведения задачи-действия.

Результаты демонстрируют, что управление памятью является независимо обучаемым навыком и высокоэффективной целью для достижения значительных улучшений в долгогоризонтных задачах.