В данной статье представлен RE4 — фреймворк для обучения с подражанием, который объединяет обоснованные теории манипуляции с современными бенчмарками для сохранения как производительности, так и интерпретируемости в задачах взаимодействия с объектами. Подход использует лёгкую самонадзорную оценку позы и преобразования с учётом режимов для эффективного извлечения и перепланирования демонстраций.
- Предлагает лёгкое обучение для оценки позы целевых объектов без модели с использованием самонадзора на данных демонстраций.
- Реализует извлечение демонстраций с учётом режима манипуляции для информирования процесса обучения.
- Применяет преобразование с учётом режима и шаг перепланирования, связанный с точкой извлечения при сохранении ограничений режима.
- Оценивает фреймворк на бенчмарках на основе состояний и изображений в задачах Push-T и Robomimic, включая состязательный бенчмарк для областей с разреженными данными.
Работа демонстрирует потенциал использования простых интерпретируемых строительных блоков для обучения навыкам манипуляции, показывая устойчивость в условиях малых объёмов данных.