RefRad2D es un conjunto de datos bilingüe a gran escala de 1.2M pares de imagen-texto de TC y RM de la práctica clínica. Entrenado con estos datos, RadGrounder logra resultados competitivos en VQA y realiza fundamentación espacial sin degradar la calidad del lenguaje, permitiendo salidas verificables en radiología.