Spotlight habilita el post-entrenamiento RL de DiT aprovechando GPUs spot inactivas, reduciendo los costos entre 1.4 y 6.4 veces mientras se logra una calidad de imagen superior. Utiliza pesos de modelo desactualizados en la exploración y reconfigura el paralelismo de secuencias en tiempo real, permitiendo un uso eficiente de las GPUs sin interrumpir los pipelines de entrenamiento.