저자는 Hugging Face Hub의 LeRobotDataset 카테고리를 위한 오픈소스 린터인 Trajlens를 소개하고, 'lerobot' 태그가 붙은 100개의 무작위 공개 데이터셋에 대한 감사 결과를 보고합니다. 감사는 검증에 통과한 데이터셋이 단 19개였으며, 13개가 특정 상류 버그로 인해 실패하고 47개가 로드 오류 또는 시간 초과를 겪었음을 밝혔습니다.
- 실패한 데이터셋 중 약 19%가 LeRobot 이슈 2401에서 식별된 에피소드-프레임 손상(v2.1에서 v3.0)으로 고통받았습니다.
- 실패의 약 3%는 LeRobot 이슈 3177과 관련된 타임스탬프 부동 소수점 드리프트로 인해 발생했습니다.
- 이 도구는 `pip install trajlens`를 통해 사용 가능하며, 특정 데이터셋을 1분 이내에 린트할 수 있습니다.
Trajlens를 실행하면 유지 관리자는 자신의 데이터가 이러한 알려진 손상 문제에 영향을 받는지 빠르게 식별하여 오픈 로봇 학습 생태계 내 데이터 품질을 보장하는 데 도움이 됩니다.