Penulis memperkenalkan Trajlens, sebuah linter open-source untuk kategori LeRobotDataset di Hugging Face Hub, dan melaporkan hasil dari audit terhadap 100 dataset publik acak yang ditandai dengan 'lerobot'. Audit mengungkapkan bahwa hanya 19 dataset yang lulus validasi, sementara 13 gagal karena bug hulu spesifik dan 47 mengalami kesalahan pemuatan atau timeout.

  • Dari dataset yang gagal, sekitar 19% mengalami korupsi episode-frame (v2.1 ke v3.0) yang diidentifikasi dalam issue LeRobot 2401.
  • Sekitar 3% kegagalan disebabkan oleh drift float timestamp, terkait dengan issue LeRobot 3177.
  • Alat ini tersedia melalui `pip install trajlens` dan dapat melint dataset tertentu dalam waktu kurang dari satu menit.

Menjalankan Trajlens memungkinkan pemelihara untuk dengan cepat mengidentifikasi apakah data mereka terpengaruh oleh masalah korupsi yang diketahui ini, membantu memastikan kualitas data di dalam ekosistem open robot-learning.