RS-Neg es el primer benchmark para evaluar la comprensión de negación en tareas de teledetección a través de escenarios a nivel de región y a nivel de escena. Revela que los MLLMs avanzados de teledetección tienen dificultades con la negación, mostrando alucinaciones y caídas de rendimiento. NeFo, un método de aprendizaje en tiempo de prueba, mejora la comprensión de la negación utilizando solo el 5% de datos de prueba sin etiquetar y se generaliza bien a nuevas tareas.
Benchmark RS-Neg y método NeFo para la comprensión de negación en MLLMs de teledetección
Traducido del English → Español