يقدم الباحثون مقياس MSQA، وهو مجموعة تقييم تتكون من 1,064 سؤالًا مصدرها أصلي عبر 11 مجموعة لغوية وخمسة أبعاد ثقافية، لاختبار الفرضية القائلة بأن الطلاقة متعددة اللغات تعني الانسجام الثقافي. تكشف التقييمات لـ 18 نموذجًا لغويًا كبيرًا عن تدهور ثقافي جوهري وتأثير محلي بارز، حيث تتبع الكفاءة التعرض المسبق للتدريب بدلاً من القدرة العامة على الاستدلال.

  • يستهدف MSQA المعرفة المتجذرة محليًا لتقليل الاختصارات الناتجة عن النقل عبر اللغات المتمحور حول الإنجليزية.
  • تظل النماذج واثقة بشكل مفرط بشأن الأسئلة الثقافية غير المألوفة رغم قدراتها متعددة اللغات.
  • يؤدي أخذ العينات المتكرر إلى دقة غير مستقرة، ويعزز الاسترجاع المساعدة بشكل غير متساوٍ على الحقائق ذات الذيل الطويل.

تشير النتائج إلى أن الانسجام الثقافي لا يمكن استنتاجه من القدرة متعددة اللغات وحدها، ويتطلب تدخلاً أعمق من المعايرة أو أخذ العينات أو الاسترجاع أثناء الاستدلال.