Um novo estudo avalia a capacidade dos Grandes Modelos de Linguagem (LLMs) de induzir estados de crença específicos em outros agentes por meio de ações, e não de conversa, uma capacidade denominada ToM de Planejamento Não Conversacional (NCP-ToM). Usando o framework NCP-ExploreToM, pesquisadores testaram seis modelos de ponta e participantes humanos em 600 instâncias de tarefas onde os agentes precisavam mover objetos ou direcionar personagens para alcançar objetivos de crença.

  • GPT-5 teve sucesso em aproximadamente 80% das tarefas no ambiente agente.
  • GPT-5 foi o único modelo a superar os participantes humanos, embora permanecesse menos robusto em diferentes contextos.
  • Todos os modelos e humanos tiveram melhor desempenho ao induzir estados de crença verdadeira do que falsa.

Os resultados destacam as capacidades emergentes de raciocínio social em LLMs para conclusão de tarefas não conversacionais e ressaltam a necessidade de avaliações de agentes para compreender a segurança e o alinhamento de agentes sociais autônomos.