著者は、Hugging Face Hub 上の LeRobotDataset カテゴリ向けのオープンソースリンターである Trajlens を紹介し、'lerobot' タグが付いた 100 のランダムな公開データセットの監査結果を発表しました。監査により、検証をパスしたのはわずか 19 のデータセットであり、13 が特定の上流バグのために失敗し、47 が読み込みエラーまたはタイムアウトに遭遇したことが明らかになりました。
- 失敗したデータセットのうち、約 19% が LeRobot イシュー 2401 で識別されたエピソードフレームの破損(v2.1 から v3.0)に見舞われました。
- 失敗の約 3% は、LeRobot イシュー 3177 にリンクされているタイムスタンプの浮動小数点ドリフトによって引き起こされました。
- このツールは `pip install trajlens` で利用可能であり、特定のデータセットを 1 分以内にリンティングできます。
Trajlens を実行することで、メンテナはこれらの既知の破損問題が自身のデータに影響を与えているかどうかを迅速に特定でき、オープンなロボティクス学習エコシステム内でのデータ品質の確保に役立ちます。