MrFlow logra una aceleración de difusión sin entrenamiento de 10-25x mediante muestreo por etapas

Los investigadores proponen MrFlow, una estrategia de aceleración multi-resolución sin entrenamiento para modelos de emparejamiento de flujos preentrenados que utiliza un pipeline escalonado de baja a alta resolución para reducir significativamente el tiempo de inferencia. El método genera la estructura principal a baja resolución, realiza superresolución en el espacio de píxeles utilizando un modelo ligero basado en GAN, inyecta ruido para el remuestreo de altas frecuencias y refina los detalles a alta resolución.

MrFlow logra hasta una aceleración end-to-end de 10.3x en Qwen-Image y 8.25x en FLUX.1-dev manteniendo OneIG dentro de una diferencia del 1% con respecto a los modelos no acelerados.
Cuando se combina con estrategias de destilación de pasos temporales preentrenadas como Pi-Flow, MrFlow puede lograr hasta una aceleración de generación de 25x.
La implementación no requiere finetuning, upsamplers aprendidos ni kernels personalizados, dependiendo de pipelines estándar de PyTorch y Diffusers.
El enfoque es compatible con las familias FLUX.1-dev, FLUX.2 Klein Base 9B, Z-Image-Turbo y Qwen-Image.

MrFlow permite a los usuarios acelerar la difusión de texto a imagen sin reentrenar modelos ni utilizar optimizaciones a nivel del sistema, lo que lo convierte en una solución práctica para una generación más rápida mientras se preserva la calidad visual.