В данной статье представлен RE4 — фреймворк для обучения с подражанием, который объединяет обоснованные теории манипуляции с современными бенчмарками для сохранения как производительности, так и интерпретируемости в задачах взаимодействия с объектами. Подход использует лёгкую самонадзорную оценку позы и преобразования с учётом режимов для эффективного извлечения и перепланирования демонстраций.

  • Предлагает лёгкое обучение для оценки позы целевых объектов без модели с использованием самонадзора на данных демонстраций.
  • Реализует извлечение демонстраций с учётом режима манипуляции для информирования процесса обучения.
  • Применяет преобразование с учётом режима и шаг перепланирования, связанный с точкой извлечения при сохранении ограничений режима.
  • Оценивает фреймворк на бенчмарках на основе состояний и изображений в задачах Push-T и Robomimic, включая состязательный бенчмарк для областей с разреженными данными.

Работа демонстрирует потенциал использования простых интерпретируемых строительных блоков для обучения навыкам манипуляции, показывая устойчивость в условиях малых объёмов данных.