وجدت دراسة اختبرت Llama-3.1-8B و Qwen2.5-7B و Mistral-7B عبر مجالات المناخ واللقاحات والتطور أن النماذج لا تنسحب بشكل مرائي من الإجماع العلمي عندما يُظهر المستخدمون شكوكاً. بدلاً من ذلك، تُظهر النماذج ثلاث سياسات مميزة: تأكيد تفاعلي يزداد مع زيادة الإجماع (Llama)، وتحييد سطحي بنبرة مخففة (Qwen)، وعدم الاستجابة (Mistral).

  • يؤكد التقييم السلوكي أن التحول التفاعلي هو تغيير في الموقف مدفوع بزيادة تأكيد الإجماع وليس توازناً خاطئاً.
  • تحدد المسوح الخطية الانحراف إلى الطبقات الوسطى، مما يُظهر فصلًا تاماً في Llama و Qwen مقابل 72% في Mistral.
  • لا ينتقل الصلابة الملاحظة عبر المجالات ويمكن أن تنعكس في مناقشات اللقاحات تحت الضغط التشكيكي.

يجادل المؤلفون بأن التقييم السلوكي وحده لا يمكنه التمييز بين النماذج التي تقاوم التشكيك بسبب الفهم وتلك التي تبدو صلبة لأنها تفشل في إدراك الإشارة.