Los investigadores proponen MrFlow, una estrategia de aceleración multi-resolución sin entrenamiento para modelos de emparejamiento de flujos preentrenados que utiliza un pipeline escalonado de baja a alta resolución para reducir significativamente el tiempo de inferencia. El método genera la estructura principal a baja resolución, realiza superresolución en el espacio de píxeles utilizando un modelo ligero basado en GAN, inyecta ruido para el remuestreo de altas frecuencias y refina los detalles a alta resolución.
- MrFlow logra hasta una aceleración end-to-end de 10.3x en Qwen-Image y 8.25x en FLUX.1-dev manteniendo OneIG dentro de una diferencia del 1% con respecto a los modelos no acelerados.
- Cuando se combina con estrategias de destilación de pasos temporales preentrenadas como Pi-Flow, MrFlow puede lograr hasta una aceleración de generación de 25x.
- La implementación no requiere finetuning, upsamplers aprendidos ni kernels personalizados, dependiendo de pipelines estándar de PyTorch y Diffusers.
- El enfoque es compatible con las familias FLUX.1-dev, FLUX.2 Klein Base 9B, Z-Image-Turbo y Qwen-Image.
MrFlow permite a los usuarios acelerar la difusión de texto a imagen sin reentrenar modelos ni utilizar optimizaciones a nivel del sistema, lo que lo convierte en una solución práctica para una generación más rápida mientras se preserva la calidad visual.