Los autores proponen RQ-TTSA, un marco consciente de la distribución diseñado para abordar la inestabilidad en la optimización bilevel causada por ruido estocástico de colas pesadas. A diferencia de las técnicas existentes de reducción de varianza que dependen de comprobaciones miope de magnitud, este método utiliza búferes de gradiente históricos para estimar cuantiles móviles para recorte adaptativo al estilo Huber. Este enfoque preserva la geometría de optimización local mientras acota estrictamente la varianza efectiva bajo supuestos no convexos-estrictamente convexos con ruido de varianza infinita. El análisis teórico deriva una tasa de convergencia de O(T^(-(p-1)/(3p-2))) que recupera la dependencia óptima del parámetro de colas pesadas p. Las evaluaciones empíricas en seis tareas diversas, incluyendo benchmarks de visión y aprendizaje por refuerzo offline, muestran un rendimiento superior consistente frente a las líneas base más avanzadas. RQ-TTSA elimina los picos de divergencia y asegura una convergencia estable con una sobrecarga computacional despreciable de aproximadamente 2.7 por ciento.
RQ-TTSA: Optimización bilevel robusta consciente de la distribución con actualizaciones Huber guiadas por cuantiles
Traducido del English → Español