ASALT: Alineación adaptativa del estado para transferencia lateral en aprendizaje por refuerzo multiagente

Este artículo presenta ASALT, un método que permite el aprendizaje de transferencia lateral en aprendizaje por refuerzo multiagente al acomodar las discrepancias en la dimensionalidad del espacio de estados entre los dominios de origen y destino. El enfoque utiliza adaptadores a nivel de observación y a nivel de estado para mapear las entradas en un espacio de incrustación compartido, facilitando una transferencia efectiva del conocimiento entre entornos heterogéneos.

ASALT incorpora adaptadores a nivel de observación y a nivel de estado para mapear las observaciones del dominio de destino y los estados globales en un espacio de incrustación compartido.
Los resultados experimentales muestran que ASALT supera a las líneas base existentes en eficiencia de muestras y retorno global en entornos cooperativos.
El método mitiga la transferencia negativa, un obstáculo importante al transferir políticas entre dominios con espacios de observación y acción diferentes.

ASALT permite una transferencia de estrategias más efectiva entre dominios heterogéneos donde los métodos anteriores requerían dimensionalidades idénticas, abordando así el desafío de la transferencia negativa en sistemas multiagente.