GPT-5, 계획 설계를 통해 신념 상태 유도에서 인간을 능가

새로운 연구는 대규모 언어 모델이 대화 대신 행동을 통해 다른 에이전트에게 특정 신념 상태를 유도하는 능력을 평가했다. 이 능력은 '비대화적 계획 ToM(NCP-ToM)'으로 명명되었다.

NCP-ExploreToM 프레임워크를 사용하여 연구진은 6개의 최첨단 모델과 인간 참가자를 테스트했으며, 에이전트가 물체를 이동하거나 캐릭터를 지시하여 신념 목표를 달성해야 하는 600개의 작업 인스턴스에서 평가했다.

이 결과는 비대화적 작업 완료에서 LLM의 부상하는 사회적 추론 능력을 부각하며, 자율 사회 에이전트의 안전성과 정렬을 이해하기 위해 에이전트 평가가 필수적임을 강조한다.