تفحص هذه الدراسة كيف تتعامل النماذج اللغوية الكبيرة مع المتطلبات المتنافسة للقيود المعجمية الصارمة والفعالية التواصلية من خلال لعب لعبة تابو. قام الباحثون بتقييم نموذجين بوزن مفتوح في ظروف تتدخل على مستويات أعمق بشكل متزايد في العملية التوليدية، بدءاً من التوجيه (prompting) وحتى عمليات تعديل التمثيل الداخلي.
- تم تقييم المخرجات من خلال كشف انتهاك الكلمات المحظورة ومقاييس LLM-as-a-judge التي تقيس مدى فعالية الأوصاف في إثارة المفهوم المستهدف للمخمين البشر والآليين.
- قارن التحليل الاستراتيجيات التي اعتمدها النماذج تحت القيود بتلك المستخدمة من قبل اللاعبين البشر.
- تشير النتائج إلى أن الامتثال للقواعد والفعالية التواصلية تتبادل بشكل مختلف عبر الظروف.
تشير النتائج إلى أن التأسيس المعجمي تحت القيود لا يزال تحدياً مفتوحاً، حيث تظل النماذج أضعف بكثير من البشر في هذه المهمة.