研究评估了“禁忌”游戏中大语言模型的约束与沟通

本研究考察了大型语言模型在玩“禁忌”游戏时，如何在严格的词汇约束和沟通有效性之间的竞争需求中导航。研究人员在干预生成过程越来越深层次的条件下评估了两个开放权重模型，范围从提示到内部表示的操纵。

研究结果暗示，在约束下的词汇基础仍然是一个开放挑战，因为模型在此任务中仍远弱于人类。