MrFlow mencapai akselerasi difusi tanpa pelatihan 10-25x melalui pengambilan sampel bertahap

Peneliti mengusulkan MrFlow, strategi akselerasi multi-resolusi tanpa pelatihan untuk model pencocokan aliran yang telah dilatih sebelumnya, yang menggunakan pipeline bertahap dari resolusi rendah ke tinggi untuk secara signifikan mengurangi waktu inferensi. Metode ini menghasilkan struktur utama pada resolusi rendah, melakukan super-resolusi di ruang piksel menggunakan model berbasis GAN ringan, menyuntikkan noise untuk pengambilan sampel ulang frekuensi tinggi, dan memperhalus detail pada resolusi tinggi.

MrFlow mencapai percepatan end-to-end hingga 10,3x pada Qwen-Image dan 8,25x pada FLUX.1-dev sambil menjaga OneIG dalam celah 1% relatif terhadap model yang tidak dipercepat.
Ketika digabungkan dengan strategi distilasi timestep pra-dilatih seperti Pi-Flow, MrFlow dapat mencapai akselerasi generasi hingga 25x.
Implementasinya tidak memerlukan finetuning, upsampler yang dipelajari, atau kernel khusus, bergantung pada pipeline PyTorch dan Diffusers standar.
Pendekatan ini kompatibel dengan FLUX.1-dev, FLUX.2 Klein Base 9B, Z-Image-Turbo, dan keluarga Qwen-Image.

MrFlow memungkinkan pengguna mempercepat difusi teks-ke-gambar tanpa melatih ulang model atau menggunakan optimisasi tingkat sistem, menjadikannya solusi praktis untuk generasi yang lebih cepat sambil mempertahankan kualitas visual.