Desviación selectiva en el tiempo de prueba para CLIP mediante gating de recompensa

Los investigadores presentan Adaptación en el Tiempo de Prueba con Gating de Recompensa (RG-TTA), un framework basado en aprendizaje por refuerzo que aplica selectivamente la corrección de sesgo a Vision Language Models según la sensibilidad al sesgo de la entrada. Este enfoque resuelve el compromiso entre equidad y utilidad inherente a los métodos de corrección uniforme, adaptando la regularización solo para consultas sensibles al sesgo.

RG-TTA activa adaptativamente la regularización de equidad durante la adaptación de la política en el tiempo de prueba según la sensibilidad al sesgo de cada entrada.
El framework se centra exclusivamente en optimizar la alineación multimodal para entradas insensibles al sesgo, preservando la información semántica.
Los experimentos en los benchmarks FairFace y UTKFace demuestran una reducción sustancial del sesgo mientras mejoran simultáneamente la utilidad zero-shot.