報酬ゲートによるCLIPの選択的テスト時デバイアシング

研究者らは、Reward-Gated Test-Time Adaptation (RG-TTA) を導入した。これは強化学習ベースのフレームワークであり、入力バイアス感度に基づいて視覚言語モデルに対して選択的にデバイアシングを適用する。このアプローチは、一様な補正方法に内在する公平性と有用性のトレードオフを解決し、バイアス感受性のあるクエリに対してのみ正則化を適応させる。

RG-TTA は、各入力のバイアス感度に基づいて、テスト時のポリシー適応中に公平性正則化を適応的にトリガーする。
このフレームワークは、セマンティック情報を保持するために、バイアス非感受性の入力に対するクロスモーダル整列の最適化に専念している。
FairFace および UTKFace ベンチマークでの実験は、ゼロショット有用性を同時に向上させながら、大幅なバイアス削減を示している。