يقدم الباحثون MECoBench، وهو معيار تعاون جسدي متعدد الوسائط مصمم لتقييم قدرات التعاون لنماذج اللغة الكبيرة متعددة الوسائط (MLLMs) في بيئات متجذرة بصريًا. يغطي المنصة مجموعة متنوعة من مهام العالم الحقيقي ويتضمن هيكلين للتعاون بالإضافة إلى ثلاثة أوضاع تعاون مميزة.

  • تكشف التجارب المكثفة أنه بينما يحسن التعاون بشكل عام إكمال المهام، فإن الفوائد تعتمد على موازنة المكاسب مقابل تعقيد التنسيق.
  • تم تحديد التواصل على أنه ضروري لنجاح التعاون، مع اختلاف الأوضاع المثلى بناءً على حجم الفريق وقدرة النموذج.
  • يُظهر المعيار أن التعاون يعزز المتانة تحت شروط الأوليات الضوضائية وظروف الاستكشاف.

يوفر MECoBench منصة اختبار منهجية لفهم آليات وحدود التعاون الجسدي متعدد الوسائط.