RegMix-D extiende RegMix aprovechando las trayectorias completas de pérdida de ejecuciones proxy para seleccionar dinámicamente mezclas de datos. Supera a RegMix y DoReMi en 13 tareas downstream, logrando resultados superiores con solo 128 modelos proxy—el 25% del presupuesto computacional de RegMix.
RegMix-D: Mezcla dinámica de datos mediante trayectorias de entrenamiento de proxies
Traducido del English → Español