Este artículo presenta ASALT, un método para el aprendizaje de transferencia lateral en el aprendizaje por refuerzo multiagente que se adapta a las dimensionalidades desiguales del espacio de estados entre los dominios de origen y destino. El enfoque utiliza adaptadores a nivel de observación y a nivel de estado para mapear las entradas en un espacio de incrustación compartido, lo que permite una transferencia efectiva del conocimiento entre entornos heterogéneos.
- ASALT incorpora adaptadores a nivel de observación y a nivel de estado para manejar los espacios de observación y de estado global diferentes.
- Los resultados experimentales muestran una mayor eficiencia en muestras y un retorno global superior en entornos cooperativos en comparación con las líneas base existentes.
- El método mitiga la transferencia negativa, un obstáculo común al transferir políticas entre dominios con diferentes dimensiones.
- La efectividad depende del grado de discrepancia entre los dominios de origen y destino.
ASALT aborda la limitación de los enfoques anteriores de transferencia en MARL que requieren dimensionalidades idénticas, permitiendo una transferencia de estrategias más flexible a través de diversos sistemas multiagente.