GPT-5 supera a los humanos en la inducción de estados de creencia mediante planificación

Un nuevo estudio evalúa la capacidad de los Modelos de Lenguaje Grande (LLM) para inducir estados de creencia específicos en otros agentes mediante acciones en lugar de conversación, una capacidad denominada ToM de Planificación No Conversacional (NCP-ToM). Utilizando el marco NCP-ExploreToM, los investigadores probaron seis modelos de vanguardia y participantes humanos en 600 instancias de tareas donde los agentes debían mover objetos o dirigir personajes para lograr objetivos de creencia.

GPT-5 tuvo éxito en aproximadamente el 80% de las tareas en el entorno agente.
GPT-5 fue el único modelo que superó a los participantes humanos, aunque permaneció menos robusto en diferentes contextos.
Todos los modelos y humanos tuvieron un mejor desempeño induciendo estados de creencia verdadera que falsa.

Los hallazgos destacan las capacidades emergentes de razonamiento social en LLMs para la finalización de tareas no conversacionales y subrayan la necesidad de evaluaciones agentes para comprender la seguridad y alineación de agentes sociales autónomos.