DanceOPD: Destilación de campos generativos con política en línea

Los autores presentan DanceOPD, un marco de destilación de campos generativos con política en línea diseñado para unificar la generación de texto a imagen con capacidades de edición local y global en modelos de emparejamiento de flujos. Este enfoque enruta las muestras a campos de capacidad específicos y entrena utilizando un objetivo de MSE de velocidad para componer habilidades expertas sin interferencia mutua.

Enruta cada muestra a un campo de capacidad y consulta un estado inducido por estudiante de bajo ruido.
Entrena con un objetivo simple de MSE de velocidad para componer capacidades expertas a partir de campos consultados en estados de rollout.
Absorbe campos definidos por el operador, como la guía sin clasificador (CFG).
Mejora la composición de múltiples capacidades mientras fortalece las capacidades objetivo y preserva la calidad de generación del ancla.

Este trabajo establece una ruta práctica para la destilación de campos generativos en modelos de emparejamiento de flujos, abordando el desafío central de componer eficazmente diversas capacidades de generación de imágenes.