연구자들은 사전 학습된 흐름 일치 모델에 대한 학습 없는 다중 해상도 가속 전략인 MrFlow를 제안했습니다. 이는 저해상도에서 고해상도로의 파이프라인을 사용하여 추론 시간을 크게 줄입니다. 이 방법은 저해상도에서 주요 구조를 생성하고, 경량 GAN 기반 모델을 사용하여 픽셀 공간에서 초해상도를 수행하며, 고주파 재샘플링을 위해 노이즈를 주입하고 고해상도에서 세부 사항을 정제합니다.
- MrFlow는 Qwen-Image에서 최대 10.3배, FLUX.1-dev에서 8.25배의 엔드투엔드 속도 향상을 달성하며, OneIG는 비가속 모델 대비 1% 이내의 격차를 유지합니다.
- Pi-Flow와 같은 사전 학습된 타임스텝 증류 전략과 결합하면 MrFlow는 최대 25배의 생성 가속을 달성할 수 있습니다.
- 이 구현에는 파인튜닝, 학습된 업샘플러 또는 커스텀 커널이 필요하지 않으며 표준 PyTorch 및 Diffusers 파이프라인에 의존합니다.
- 이 접근 방식은 FLUX.1-dev, FLUX.2 Klein Base 9B, Z-Image-Turbo 및 Qwen-Image 패밀리와 호환됩니다.
MrFlow를 사용하면 모델을 재학습하거나 시스템 수준 최적화를 사용하지 않고 텍스트에서 이미지로의 확산을 가속화할 수 있어 시각적 품질을 유지하면서 더 빠른 생성을 위한 실용적인 솔루션이 됩니다.