التفكير الذاتي المتجذر بصرياً لنماذج الرؤية واللغة عبر التعلم التعزيزي

يقترح المؤلفون إطار عمل VRRL للتعلم التعزيزي، المصمم لتمكين نماذج الرؤية واللغة من إجراء تفكير ذاتي متجذر بصرياً أثناء الاستدلال المتسلسل.

يقوم VRRL بإخفاء بادئات المسار عشوائياً أثناء التدريب للتأكيد على التعافي من التنبؤات الوسيطة غير الصحيحة.
تقدم الطريقة إدخالات مخزنة مؤقتاً من ذاكرة إعادة التجربة لتعرية النموذج لحالات الفشل المتنوعة.
أظهرت التقييمات على مهام التجذر البصري التي تتضمن جداول ورسوم بيانية، بالإضافة إلى معايير الملاحة المكانية، تحسناً كبيراً في الدقة خارج التوزيع مقارنة بأساسيات التعلم التعزيزي القياسية.