ASALT: Alineación adaptativa del estado para transferencia lateral en aprendizaje por refuerzo multiagente

Este artículo presenta ASALT, un método para el aprendizaje de transferencia lateral en el aprendizaje por refuerzo multiagente que se adapta a las dimensionalidades desiguales del espacio de estados entre los dominios de origen y destino. El enfoque utiliza adaptadores a nivel de observación y a nivel de estado para mapear las entradas en un espacio de incrustación compartido, lo que permite una transferencia efectiva del conocimiento entre entornos heterogéneos.

ASALT incorpora adaptadores a nivel de observación y a nivel de estado para manejar los espacios de observación y de estado global diferentes.
Los resultados experimentales muestran una mayor eficiencia en muestras y un retorno global superior en entornos cooperativos en comparación con las líneas base existentes.
El método mitiga la transferencia negativa, un obstáculo común al transferir políticas entre dominios con diferentes dimensiones.
La efectividad depende del grado de discrepancia entre los dominios de origen y destino.

ASALT aborda la limitación de los enfoques anteriores de transferencia en MARL que requieren dimensionalidades idénticas, permitiendo una transferencia de estrategias más flexible a través de diversos sistemas multiagente.