MrFlow atteint une accélération de diffusion sans entraînement de 10 à 25x via un échantillonnage par étapes

Les chercheurs proposent MrFlow, une stratégie d'accélération multi-résolution sans entraînement pour les modèles de correspondance de flux pré-entraînés, qui utilise un pipeline progressif de basse à haute résolution pour réduire considérablement le temps d'inférence. La méthode génère la structure principale à basse résolution, effectue une super-résolution dans l'espace pixel en utilisant un modèle GAN léger, injecte du bruit pour le resampling haute fréquence et affine les détails à haute résolution.

MrFlow atteint jusqu'à 10,3x d'accélération de bout en bout sur Qwen-Image et 8,25x sur FLUX.1-dev tout en maintenant OneIG dans un écart de 1% par rapport aux modèles non accélérés.
Combiné avec des stratégies de distillation de timestep pré-entraînées comme Pi-Flow, MrFlow peut atteindre jusqu'à 25x d'accélération de génération.
L'implémentation ne nécessite aucun finetuning, upsamplers appris ou noyaux personnalisés, s'appuyant sur les pipelines standard PyTorch et Diffusers.
L'approche est compatible avec FLUX.1-dev, FLUX.2 Klein Base 9B, Z-Image-Turbo et la famille Qwen-Image.

MrFlow permet aux utilisateurs d'accélérer la diffusion texte-image sans réentraîner les modèles ou utiliser d'optimisations au niveau du système, ce qui en fait une solution pratique pour une génération plus rapide tout en préservant la qualité visuelle.