ما وراء الارتباك: إطار تقييم سلوكي لادعاءات ذاكرة النشر في تدريب نموذج اللغة الكبير عند وقت الاختبار

تقدم المقالة إطارًا لتقييم السلوك لمعايرة ادعاءات ذاكرة التدريب عند وقت الاختبار (TTT) مقابل قدرات النشر الفعلية مثل التخصيص والاسترجاع. وتجادل بأن المقاييس الوسيطة القياسية مثل الارتباك هي أدلة غير كافية لهذه السلوكيات المتقدمة، والتي تتطلب التحقق السلوكي المباشر.

يتضمن الإطار سلم أدلة معاير بالادعاء يميز بين التكيف مع التدفق والتعلم السلوكي أثناء النشر.
يستخدم بروتوكول تقييم مع خطوط أساس ذاكرة صريحة وفئات فشل متبادلة الاستبعاد.
أظهر التحقق من خلال تشخيص خاضع للرقابة على نماذج Qwen3 أنه بينما تقلل تحديثات LoRA ذات الخطوة الواحدة من دعم الخسارة وخسارة الإجابة، يظل الاسترجاع الحر عند الصفر.

يوفر هذا النهج للمؤلفين والمقيمين معيارًا ملموسًا لمواءمة ادعاءات ذاكرة TTT مع الأدلة المبلغ عنها فعليًا.