يقدم الباحثون تكيف وقت الاختبار المعتمد على عتبة المكافأة (RG-TTA)، وهو إطار عمل قائم على التعلم التعزيزي يطبق إزالة التحيز بشكل انتقائي على نماذج اللغة والرؤية بناءً على حساسية التحيز للإدخال. يحل هذا النهج المقايضة بين الإنصاف والمنفعة الكامنة في طرق التصحيح الموحدة من خلال تكييف التنظيم فقط للاستعلامات الحساسة للتحيز.
- يقوم RG-TTA بتفعيل تنظيم الإنصاف بشكل تكيفي أثناء تكيف السياسة في وقت الاختبار بناءً على حساسية التحيز لكل إدخال.
- يركز الإطار حصريًا على تحسين محاذاة المقاطع المتعددة للإدخالات غير الحساسة للتحيز للحفاظ على المعلومات الدلالية.
- تُظهر التجارب على معايير FairFace و UTKFace انخفاضًا كبيرًا في التحيز مع تحسين المنفعة ذات الصفر لقطات في الوقت نفسه.