MAMO introduce un enfoque de aprendizaje por refuerzo multiagente para abordar el desafío de equilibrar la minimización de costos y la satisfacción de restricciones en entornos dinámicos. Desacopla la ejecución de tareas de la selección de pesos de recompensa, tratando la elección de pesos como un problema de aprendizaje para permitir soluciones más autónomas y robustas.
MAMO: Sistema Multiagente para Optimización Restringida con Múltiples Objetivos
Traducido del English → Español