Авторы представляют DanceOPD, фреймворк дистилляции генеративного поля с использованием on-policy подхода, предназначенный для объединения генерации изображений по тексту с возможностями локального и глобального редактирования в моделях flow-matching. Этот подход маршрутизирует выборки к конкретным полям возможностей и обучается с использованием целевой функции MSE скорости (velocity) для композиции экспертных навыков без взаимных помех.
- Маршрутизирует каждую выборку к одному полю возможностей и запрашивает одно состояние студента с низким уровнем шума, индуцированное полем.
- Обучается с помощью простой целевой функции MSE скорости для композиции экспертных возможностей из полей, запрошенных на состояниях rollout.
- Поглощает поля, определенные оператором, такие как guidance без классификатора (CFG).
- Улучшает композицию множественных возможностей, одновременно усиливая целевые возможности и сохраняя качество якорной генерации.
Эта работа устанавливает практический путь для дистилляции генеративного поля в моделях flow-matching, решая центральную задачу эффективной композиции разнообразных возможностей генерации изображений.