Исследователи предлагают адаптацию во время тестирования с гейтированием вознаграждения (RG-TTA) — основанную на обучении с подкреплением framework, которая селективно применяет устранение смещения к Vision Language Models в зависимости от чувствительности входных данных к смещению. Этот подход решает компромисс между справедливостью и полезностью, присущий методам равномерной коррекции, адаптируя регуляризацию только для запросов, чувствительных к смещению.
- RG-TTA адаптивно активирует регуляризацию справедливости во время адаптации политики во время тестирования на основе чувствительности каждого входа к смещению.
- Framework фокусируется исключительно на оптимизации кросс-модального выравнивания для входов, нечувствительных к смещению, чтобы сохранить семантическую информацию.
- Эксперименты на бенчмарках FairFace и UTKFace демонстрируют существенное снижение смещения при одновременном улучшении нуль-шот полезности.