В статье представлен WorldEvolver — фреймворк, который оснащает долгосрочных агентов LLM надежной способностью к предвидению за счет пересмотра контекста во время развертывания без изменения параметров модели. Он решает проблему ненадежных прогнозов, ухудшающих принятие решений, с помощью самоэволюционирующего подхода, повышающего точность предсказаний и качество планирования.

  • Эпизодическая память извлекает реальные переходы действий для симуляции.
  • Семантическая память извлекает устойчивые эвристические правила из несоответствий между прогнозами и наблюдениями.
  • Селективное предвидение фильтрует прогнозы с низкой уверенностью перед интеграцией.
  • Оценено на ALFWorld и ScienceWorld, демонстрирует наивысшую точность предсказаний среди трех бэкбонов.
  • Обходит другие базовые методы по доле успешных действий агента, измеренной на AgentBoard.

Этот подход демонстрирует, что пересмотр памяти во время тестирования значительно улучшает как точность прогнозов модели мира, так и общую долю успеха задач планирования агента.