RefRad2D es un conjunto de datos bilingüe a gran escala de 1.2M pares de imagen-texto de TC y RM de la práctica clínica. Entrenado con estos datos, RadGrounder logra resultados competitivos en VQA y realiza fundamentación espacial sin degradar la calidad del lenguaje, permitiendo salidas verificables en radiología.
El conjunto de datos RefRad2D permite la fundamentación espacial escalable en radiología
Traducido del English → Español