R2D-RL: среда 2D футбола RoboCup для MARL
R2D-RL связывает RCSS2D и клиенты на базе HELIOS с помощью интерфейса Python для MARL, используя общий памяти и синхронизацию на уровне циклов. Оно позволяет проводить обучение на поле и в сценариях с настраиваемыми противниками, масками действий, формирования вознаграждений на основе EPV и параллельной обработкой, включая сценарии перед воротами и бенчмарк 11-на-11 с базовыми результатами.