La Fusión de Modelos Dirigible (ST-Merge) introduce un mecanismo de atención cruzada con compuertas para ponderar adaptativamente los modelos fuente durante el razonamiento multilingüe. Supera a las líneas base existentes en cuatro benchmarks de razonamiento multilingüe en 21 idiomas al priorizar dinámicamente los modelos según las características de la entrada.
Fusión de Modelos Dirigible para Razonamiento Multilingüe
Traducido del English → Español