CoorDex: Координация априорных знаний о теле и кистях для непрерывной манипуляции с перемещением у человекоподобных роботов
Авторы представляют CoorDex, конвейер обучения, обеспечивающий ловкую манипуляцию с перемещением у человекоподобных роботов с высокой степенью свободы. Данный подход преобразует высокоразмерное управление телом и кистью в скоординированное латентное остаточное управление, преодолевая ограничения традиционных методов «стоп-и-иди». Система обучает учителей отслеживания привилегированных движений на основе симулированных демонстраций и дистиллирует их в латентные априорные знания, обусловленные проприоцепцией. Эти замороженные априорные знания служат пространством действий для последующего остаточного обучения с подкреплением посредством политики, которая комбинирует контекст задачи с отдельными остаточными головами для тела и кисти. CoorDex позволяет человекоподобному роботу Unitree G1, оснащенному 20-свободной кистью WUJI, выполнять сложные задачи в движении, такие как захват бутылки без остановки и открывание дверцы холодильника. Аблиционные исследования демонстрируют, что PPO в пространстве суставов и монолитное латентное предсказание не справляются при аналогичных бюджетах вознаграждения, тогда как предложенный интерфейс латентных априорных знаний обеспечивает обучаемость для манипуляций с частыми контактами.