RE4: Преобразование с учётом трансформаций в имитации взаимодействий объектов с использованием режимов манипуляции

В данной статье представлен RE4 — фреймворк для обучения с подражанием, который объединяет обоснованные теории манипуляции с современными бенчмарками для сохранения как производительности, так и интерпретируемости в задачах взаимодействия с объектами. Подход использует лёгкую самонадзорную оценку позы и преобразования с учётом режимов для эффективного извлечения и перепланирования демонстраций.

Предлагает лёгкое обучение для оценки позы целевых объектов без модели с использованием самонадзора на данных демонстраций.
Реализует извлечение демонстраций с учётом режима манипуляции для информирования процесса обучения.
Применяет преобразование с учётом режима и шаг перепланирования, связанный с точкой извлечения при сохранении ограничений режима.
Оценивает фреймворк на бенчмарках на основе состояний и изображений в задачах Push-T и Robomimic, включая состязательный бенчмарк для областей с разреженными данными.

Работа демонстрирует потенциал использования простых интерпретируемых строительных блоков для обучения навыкам манипуляции, показывая устойчивость в условиях малых объёмов данных.