arxiv arXiv cs.AI · hace 1 h · fuente: hace 12 d · research

STAR: Asignación de recompensa adaptativa espaciotemporal para el post-entrenamiento RL de texto a imagen

Traducido del English → Español

STAR introduce un método de asignación de recompensa espaciotemporal para la generación de texto a imagen, utilizando mapas de atención para asignar dinámicamente ventajas en los pasos de desruido. Mejora la alineación semántica, la renderización de texto y la optimización de preferencias en Stable Diffusion 3.5 Medium, logrando 0.9759, 0.9757 y 23.60 en GenEval, OCR y PickScore respectivamente.

Importancia 3/3 Nueva función frente a los líderes Nuevo entorno de evaluación con diferenciadores arXiv cs.AI Stability AI Image generation Reasoning models Training methods

Leer original