研究者らは、AutoMemを発表した。これは大規模言語モデルにおけるメモリ管理を静的な構成要素ではなく、訓練可能なスキルとして扱うフレームワークである。このシステムはファイルシステム操作を第一級のメモリアクションへと昇格させ、モデルが知識のエンコーディング、取得、整理の方法を自律的に決定できるようにする。

  • AutoMemは2つの改善軸を自動化する:メモリ構造(プロンプト、スキーマ、語彙)と、それを使用するモデルの熟練度。
  • 強力なLLMはエージェントの軌跡をレビューし、反復的にメモリ構造を修正する。一方、エージェントの成功した決定は熟練度を高めるための訓練信号として機能する。
  • 手動生成された長期ホライズンゲームであるCrafter、MiniHack、NetHackでのテストでは、メモリのみを最適化することでベースエージェントのパフォーマンスが2倍から4倍向上した。
  • このアプローチにより、32Bのオープンウェイトモデルが、タスクアクション行動を変更することなく、Claude Opus 4.5やGemini 3.1 Pro Thinkingのような最先端システムと競合する水準に達した。

この結果は、メモリ管理が独立して学習可能なスキルであり、長期ホライズンタスクで大きな成果を得るための高いレバレッジを持つ目標であることを示している。