Un estudio introduce la divergencia JS en la alineación autoregresiva de texto a imagen al estilo GRPO, mostrando que equilibra eficazmente la optimización de la política y la diversidad de generación. Los experimentos en LlamaGen y Janus-7B demuestran que la divergencia JS logra un rendimiento superior o competitivo en todas las métricas mientras preserva salidas diversas.