LOTUS تربط بين الاستدلال الضمني والصريح باستخدام محولات متكررة

يقدم الباحثون طريقة LOTUS، التي تستخدم محولات متكررة مع حشو لإجراء استدلال متعدد الخطوات في الحالات المخفية، مما يسد فجوة الأداء بفعالية بين سلسلة التفكير الضمنية والصريحة عند مقياس 3 مليارات معلمة. يعالج النموذج K كتلة ضمنية بالتوازي لـ R تكرارًا باستخدام فقدان الانتروبيا المتقاطعة على رموز خطوة CoT الذهبية.

LOTUS هي أول طريقة CoT ضمنية تساوي أداء CoT الصريح عند مقياس 3B.
تقلل من زمن تأخير مرحلة التفكير بمقدار 2.5x إلى 6.9x مقارنة بالتوليد رمزًا تلو الآخر.
يؤدي إسقاط المتجهات الضمنية بعد الحلقة عبر رأس النموذج اللغوي الأساسي إلى استعادة خطوات الاستدلال الذهبية وإبراز خطوات وسيطة بديلة صالحة.
تؤكد الاختبارات المعزولة أن كلًا من الهيكل العظمي المتكرر والإشراف المتوازي على رموز CoT الذهبية ضروريان لهذا الأداء.

تُظهر هذه النهج أن الفضاءات الضمنية يمكن أن تكون قابلة للتفسير ومتوافقة مع CoT، مما يوفر بديلاً أكثر كفاءة من التوليد الصريح للرموز لمهام الاستدلال المعقدة.