研究人员推出了 AutoMem,这是一个框架,将大语言模型中的记忆管理视为一种可训练的技能,而非静态组件。该系统将文件系统操作提升为一等公民的记忆操作,使模型能够自主决定如何编码、检索和组织知识。

  • AutoMem 自动化了两个改进维度:记忆结构(提示、模式、词汇表)和模型使用它的熟练度。
  • 强大的 LLM 审查智能体轨迹以迭代地修订记忆结构,而智能体的成功决策则作为训练信号来提升熟练度。
  • 在程序生成的长视距游戏 Crafter、MiniHack 和 NetHack 上的测试表明,仅优化记忆就将基础智能体性能提高了 2x-4x。
  • 这种方法使一个 32B 的开源模型在与 Claude Opus 4.5 和 Gemini 3.1 Pro Thinking 等前沿系统竞争时表现出色,且未修改任务-动作行为。

结果表明,记忆管理是一种可独立学习的技能,也是实现长视距任务显著增益的高杠杆目标。