DIFE audita la exposición a backdoors de CLIP en interfaces de despliegue

DIFE evalúa checkpoints de CLIP con backdoors en diferentes interfaces de despliegue, revelando que el éxito nativo no garantiza seguridad en la reutilización. El framework muestra que el envenenamiento del lado textual permite exposición adversaria en tareas de recuperación, reranking y selección, mientras que el uso únicamente visual permanece mayormente sin afectar. Se introduce BadTextTower para generar una exposición fuerte condicionada por texto sin comprometer el rendimiento visual.