تحديات وتوصيات لنماذج LLM-as-a-Judge في الإعدادات متعددة اللغات
تفحص هذه المقالة موثوقية استخدام النماذج اللغوية الكبيرة كمقيّمين في سياقات متعددة اللغات ولغات ذات موارد محدودة، مسلطة الضوء على فجوات كبيرة في الممارسات الحالية. حلّل المؤلفون 650 ورقة من مجموعة ACL Anthology لتحديد التناقضات والاعتماد المفرط على نماذج حكم فردية.