स्टेज्ड सैम्पलिंग के माध्यम से MrFlow ने 10-25x प्रशिक्षण-मुक्त डिफ्यूजन त्वरण हासिल किया

अनुसंधानकर्ताओं ने MrFlow का प्रस्ताव रखा है, जो प्रीट्रेन फ्लो-मैचिंग मॉडल्स के लिए एक प्रशिक्षण-मुक्त बहु-रिज़ॉल्यूशन त्वरण रणनीति है, जो कम से उच्च रिज़ॉल्यूशन पाइपलाइन का उपयोग करके निष्पादन समय को काफी कम करती है। यह विधि कम रिज़ॉल्यूशन पर मुख्य संरचना उत्पन्न करती है, एक हल्के GAN-आधारित मॉडल का उपयोग करके पिक्सेल स्पेस में सुपर-रिज़ॉल्यूशन करता है, उच्च-फ्रीक्वेंसी रिसैम्पलिंग के लिए शोर डालता है, और उच्च रिज़ॉल्यूशन पर विवरण को परिष्कृत करता है।

MrFlow ने Qwen-Image पर 10.3x तक एंड-टू-एंड स्पीडअप और FLUX.1-dev पर 8.25x हासिल किया, जबकि OneIG को अतुर्णित मॉडल्स के सापेक्ष 1% की सीमा में बनाए रखते हुए।
Pi-Flow जैसे प्री-ट्रेन टाइमस्टेप डिस्टिलेशन रणनीतियों के साथ संयोजन में, MrFlow 25x तक जनरेशन त्वरण हासिल कर सकता है।
इस कार्यान्वयन को फाइन-ट्यूनिंग, सीखे गए अपसैम्पलर्स या कस्टम kernels की आवश्यकता नहीं है, यह मानक PyTorch और Diffusers पाइपलाइन पर निर्भर करता है।
यह दृष्टिकोण FLUX.1-dev, FLUX.2 Klein Base 9B, Z-Image-Turbo, और Qwen-Image परिवारों के साथ संगत है।

MrFlow उपयोगकर्ताओं को मॉडल को पुनः प्रशिक्षित किए बिना या सिस्टम-स्तर के अनुकूलनों का उपयोग किए बिना टेक्स्ट-टू-इमेज डिफ्यूजन को त्वरित करने की अनुमति देता है, जिससे दृश्य गुणवत्ता को बनाए रखते हुए तेज़ जनरेशन के लिए यह एक व्यावहारिक समाधान बन जाता है।