FAST aborda la ineficiencia del muestreo en el aprendizaje por refuerzo para conducción autónoma introduciendo Alineamiento de Muestreo Paralelo Dinámico para desacoplar los bucles de muestreo de las terminaciones individuales de episodios. Logra una aceleración de hasta 1.78 veces en tiempo real frente a líneas base de un solo clip, manteniendo la ausencia de sesgo estadístico mediante Optimización de Relleno de Máscara Escalada.
FAST: Un marco para muestreo alineado y entrenamiento en aprendizaje por refuerzo paralelo
Traducido del English → Español