MrFlow alcança aceleração de difusão sem treinamento de 10 a 25x via amostragem em etapas

Pesquisadores propõem o MrFlow, uma estratégia de aceleração multi-resolução sem treinamento para modelos de correspondência de fluxo pré-treinados que utiliza um pipeline de baixa para alta resolução em etapas para reduzir significativamente o tempo de inferência. O método gera a estrutura principal em baixa resolução, realiza super-resolução no espaço de pixels usando um modelo leve baseado em GAN, injeta ruído para reamostragem de altas frequências e refina os detalhes em alta resolução.

MrFlow alcança aceleração end-to-end de até 10,3x no Qwen-Image e 8,25x no FLUX.1-dev, mantendo o OneIG dentro de uma margem de 1% em relação aos modelos não acelerados.
Quando combinado com estratégias de destilação de timestep pré-treinadas como Pi-Flow, o MrFlow pode alcançar aceleração de geração de até 25x.
A implementação não requer finetuning, upsamplers aprendidos ou kernels personalizados, dependendo apenas dos pipelines padrão do PyTorch e Diffusers.
A abordagem é compatível com as famílias FLUX.1-dev, FLUX.2 Klein Base 9B, Z-Image-Turbo e Qwen-Image.

O MrFlow permite que os usuários acelerem a difusão de texto para imagem sem retreinar modelos ou usar otimizações em nível de sistema, tornando-o uma solução prática para geração mais rápida enquanto preserva a qualidade visual.