فهم النماذج اللغوية الكبيرة: القدرات الناشئة وديباقات الإدراك

يرسم هذا الفصل فهمنا الحالي للنماذج اللغوية الكبيرة (LLMs) من خلال فحص آلياتها، وقدراتها الناشئة، والنقاش الدائر حول علاقتها بالإدراك البشري. ويؤكد كيف يمكّن آلية الانتباه في بنية Transformer النماذج LLMs من العمل كنماذج عامة تم تدريبها على مجموعات بيانات ضخمة.

يستعرض النص أدلة على أن نماذج LLMs تُظهر قدرات ناشئة تشبه الإدراك البشري، مثل الاستدلال الرمزي، ونظرية العقل، واستراتيجيات الخداع.
تسلط الدراسات الضوء على كل من حالات النجاح في حل المهام المعقدة وحالات الفشل التي تكشف عن الاختلافات بين الإدراك البشري وإدراك نماذج LLMs.
تُناقش أساليب الذكاء الاصطناعي القابلة للتفسير، بما في ذلك تحليل تنشيط الخلايا العصبية وتتبع الدوائر.
يجادل المؤلفون ضد الآفات التبسيطية المختزلة التي تعزو سلوك نماذج LLMs حصرياً إلى حفظ الأنماط، داعين إلى مناقشة أكثر دقة لإدراك الذكاء الاصطناعي.

يؤكد المؤلفون أن رفض فهم نماذج LLMs استناداً إلى أهداف تدريب بسيطة ينبع من مفاهيم خاطئة حول عمليات التحسين. ويقترحون منظوراً متوازناً يعترف بالاختلافات بين البشر ونماذج LLMs مع السماح بإمكانية وجود إدراك حقيقي للذكاء الاصطناعي.