Vision-Default, Prior-Override: Mecanismos causales del conflicto entre percepción y conocimiento en modelos de visión-lenguaje
Este estudio investiga cómo los modelos de visión-lenguaje resuelven conflictos entre evidencia visual y conocimiento mundial memorizado combinando parcheo de activación con análisis mecanicista a través de tres familias de modelos. La investigación identifica un circuito causal disperso donde el anclaje visual es el predeterminado, mientras que sobrescribirlo con conocimiento previo requiere cabezales de atención específicos.