タブーゲームにおけるLLMの制約とコミュニケーションを評価した研究

本研究は、大規模言語モデルが厳格な語彙制約とコミュニケーションの有効性という競合する要求を、タブーゲームをプレイすることでどのように処理するかを検証する。研究者たちは、プロンプトから内部表現の操作まで、生成プロセスのより深いレベルで介入する条件下で、2つのオープンウェイトモデルを評価した。

これらの知見は、制約下での語彙的グラウンディングが依然として未解決の課題であることを示唆しており、モデルはこのタスクにおいて人間よりも大幅に劣っている。