IA Agéntica para la Optimización Bínivel de Largo Plazo en Sistemas de Capa Física Basados en Políticas

Este artículo presenta Agentic-LTPO, un marco de optimización bínivel anidado diseñado para abordar las limitaciones de los métodos de objetivo fijo en sistemas de capa física que enfrentan políticas de operador dinámicas y restricciones en tiempo real. El marco utiliza IA agéntica para generar configuraciones de nivel superior que traducen las políticas evolutivas y la experiencia histórica en problemas estructurados de nivel inferior para la toma de decisiones inmediata.

Agentic-LTPO emplea una estructura bínivel anidada donde un nivel superior genera configuraciones basadas en cambios de política y resúmenes del entorno, mientras que un nivel inferior resuelve estos para decisiones de capa física en tiempo real.
El estudio utiliza la formación de haces MIMO sin celdas como caso de uso, implementando un proceso de decisión multiagente con verificación basada en experiencia aumentada por recuperación en el nivel superior y un formador de haces de forma cerrada en el nivel inferior.
Los experimentos muestran que Agentic-LTPO mejora efectivamente el rendimiento del sistema a largo plazo en un 57,2 % en comparación con los métodos tradicionales, mientras mantiene una fuerte adaptabilidad a las políticas dinámicas del operador.

Este enfoque permite que los sistemas de capa física permanezcan efectivos y adaptables a pesar de los cambios en los requisitos de servicio y las estrictas restricciones en tiempo real, ofreciendo una mejora significativa en el rendimiento a largo plazo sobre las técnicas de optimización estática.