MELT y SALT: Aprendizaje contrastivo multimodal para incrustaciones geográficas
MELT y SALT son modelos de aprendizaje contrastivo multimodal que utilizan datos geoespaciales no emparejados para mejorar las incrustaciones de ubicación. Ambos logran un rendimiento igual al mejor modelo base de dos modalidades en cuatro tareas, pero añadir más modalidades no mejora consistentemente los resultados, lo que indica que el diseño del codificador de ubicación es la principal limitación del rendimiento. MELT ofrece un entrenamiento más estable y es más adecuado para la escalabilidad futura de modelos.