Los investigadores presentan Adaptación en el Tiempo de Prueba con Gating de Recompensa (RG-TTA), un framework basado en aprendizaje por refuerzo que aplica selectivamente la corrección de sesgo a Vision Language Models según la sensibilidad al sesgo de la entrada. Este enfoque resuelve el compromiso entre equidad y utilidad inherente a los métodos de corrección uniforme, adaptando la regularización solo para consultas sensibles al sesgo.
- RG-TTA activa adaptativamente la regularización de equidad durante la adaptación de la política en el tiempo de prueba según la sensibilidad al sesgo de cada entrada.
- El framework se centra exclusivamente en optimizar la alineación multimodal para entradas insensibles al sesgo, preservando la información semántica.
- Los experimentos en los benchmarks FairFace y UTKFace demuestran una reducción sustancial del sesgo mientras mejoran simultáneamente la utilidad zero-shot.