STAR introduce un método de asignación de recompensa espaciotemporal para la generación de texto a imagen, utilizando mapas de atención para asignar dinámicamente ventajas en los pasos de desruido. Mejora la alineación semántica, la renderización de texto y la optimización de preferencias en Stable Diffusion 3.5 Medium, logrando 0.9759, 0.9757 y 23.60 en GenEval, OCR y PickScore respectivamente.
STAR: Asignación de recompensa adaptativa espaciotemporal para el post-entrenamiento RL de texto a imagen
Traducido del English → Español