L'auteur présente Trajlens, un linter open-source pour la catégorie LeRobotDataset sur Hugging Face Hub, et rapporte les résultats de l'audit de 100 datasets publics aléatoires tagués avec 'lerobot'. L'audit a révélé que seuls 19 datasets ont passé la validation, tandis que 13 ont échoué en raison de bugs spécifiques en amont et que 47 ont rencontré des erreurs de chargement ou des timeouts.
- Parmi les datasets ayant échoué, environ 19 % souffraient de corruption episode-frame (v2.1 à v3.0) identifiée dans l'issue LeRobot 2401.
- Environ 3 % des échecs étaient causés par une dérive float des timestamps, liée à l'issue LeRobot 3177.
- L'outil est disponible via `pip install trajlens` et peut lint un dataset spécifique en moins d'une minute.
L'exécution de Trajlens permet aux mainteneurs d'identifier rapidement si leurs données sont affectées par ces problèmes de corruption connus, aidant à garantir la qualité des données au sein de l'écosystème open robot-learning.