DanceOPD: Дистилляция генеративного поля с использованием on-policy подхода

Авторы представляют DanceOPD, фреймворк дистилляции генеративного поля с использованием on-policy подхода, предназначенный для объединения генерации изображений по тексту с возможностями локального и глобального редактирования в моделях flow-matching. Этот подход маршрутизирует выборки к конкретным полям возможностей и обучается с использованием целевой функции MSE скорости (velocity) для композиции экспертных навыков без взаимных помех.

Маршрутизирует каждую выборку к одному полю возможностей и запрашивает одно состояние студента с низким уровнем шума, индуцированное полем.
Обучается с помощью простой целевой функции MSE скорости для композиции экспертных возможностей из полей, запрошенных на состояниях rollout.
Поглощает поля, определенные оператором, такие как guidance без классификатора (CFG).
Улучшает композицию множественных возможностей, одновременно усиливая целевые возможности и сохраняя качество якорной генерации.

Эта работа устанавливает практический путь для дистилляции генеративного поля в моделях flow-matching, решая центральную задачу эффективной композиции разнообразных возможностей генерации изображений.