GPT-5 превосходит людей в формировании состояний веры через планирование

Новое исследование оценивает способность больших языковых моделей формировать конкретные состояния веры у других агентов посредством действий, а не диалога; эта способность называется Непрерывное планирование ToM (NCP-ToM). Используя фреймворк NCP-ExploreToM, исследователи протестировали шесть передовых моделей и участников-людей на 600 задачах, где агентам нужно было перемещать объекты или направлять персонажей для достижения целей веры.

GPT-5 успешно справился примерно с 80% задач в агентном режиме.
GPT-5 стал единственной моделью, превзошедшей участников-людей, хотя она оставалась менее устойчивой в разных контекстах.
Все модели и люди лучше справлялись с формированием истинных состояний веры, чем ложных.

Результаты подчеркивают развивающиеся способности к социальному рассуждению у LLM для завершения неконверсационных задач и отмечают необходимость агентных оценок для понимания безопасности и выравнивания автономных социальных агентов.