Les chercheurs proposent MrFlow, une stratégie d'accélération multi-résolution sans entraînement pour les modèles de correspondance de flux pré-entraînés, qui utilise un pipeline progressif de basse à haute résolution pour réduire considérablement le temps d'inférence. La méthode génère la structure principale à basse résolution, effectue une super-résolution dans l'espace pixel en utilisant un modèle GAN léger, injecte du bruit pour le resampling haute fréquence et affine les détails à haute résolution.

  • MrFlow atteint jusqu'à 10,3x d'accélération de bout en bout sur Qwen-Image et 8,25x sur FLUX.1-dev tout en maintenant OneIG dans un écart de 1% par rapport aux modèles non accélérés.
  • Combiné avec des stratégies de distillation de timestep pré-entraînées comme Pi-Flow, MrFlow peut atteindre jusqu'à 25x d'accélération de génération.
  • L'implémentation ne nécessite aucun finetuning, upsamplers appris ou noyaux personnalisés, s'appuyant sur les pipelines standard PyTorch et Diffusers.
  • L'approche est compatible avec FLUX.1-dev, FLUX.2 Klein Base 9B, Z-Image-Turbo et la famille Qwen-Image.

MrFlow permet aux utilisateurs d'accélérer la diffusion texte-image sans réentraîner les modèles ou utiliser d'optimisations au niveau du système, ce qui en fait une solution pratique pour une génération plus rapide tout en préservant la qualité visuelle.