Este artículo presenta RE4, un marco para el aprendizaje por imitación que combina teorías fundamentadas de manipulación con benchmarks modernos para preservar tanto el rendimiento como la interpretabilidad en tareas de interacción con objetos. El enfoque utiliza estimación de pose ligera y auto-supervisada, junto con transformaciones conscientes del modo, para recuperar y replanificar demostraciones de manera efectiva.
- Propone un entrenamiento ligero para la estimación de pose sin modelo de objetos objetivo utilizando auto-supervisión sobre datos de demostración.
- Implementa una recuperación consciente del modo de manipulación de demostraciones para informar el proceso de aprendizaje.
- Aplica transformación consciente del modo y un paso de replanificación que se conecta al punto de recuperación mientras preserva las restricciones del modo.
- Evalúa el marco en benchmarks basados en estados e imágenes en Push-T y Robomimic, incluyendo un benchmark adversarial para regiones de datos escasos.
El trabajo demuestra la promesa de utilizar bloques de construcción simples e interpretables para aprender habilidades de manipulación, mostrando robustez en regímenes con pocos datos.