Новое исследование оценивает способность больших языковых моделей формировать конкретные состояния веры у других агентов посредством действий, а не диалога; эта способность называется Непрерывное планирование ToM (NCP-ToM). Используя фреймворк NCP-ExploreToM, исследователи протестировали шесть передовых моделей и участников-людей на 600 задачах, где агентам нужно было перемещать объекты или направлять персонажей для достижения целей веры.
- GPT-5 успешно справился примерно с 80% задач в агентном режиме.
- GPT-5 стал единственной моделью, превзошедшей участников-людей, хотя она оставалась менее устойчивой в разных контекстах.
- Все модели и люди лучше справлялись с формированием истинных состояний веры, чем ложных.
Результаты подчеркивают развивающиеся способности к социальному рассуждению у LLM для завершения неконверсационных задач и отмечают необходимость агентных оценок для понимания безопасности и выравнивания автономных социальных агентов.