作者介绍了 Trajlens,这是 Hugging Face Hub 上 LeRobotDataset 类别的一个开源 linter,并报告了对标记为 'lerobot' 的 100 个随机公共数据集进行审计的结果。审计显示,只有 19 个数据集通过了验证,其中 13 个因特定的上游 bug 而失败,47 个遇到加载错误或超时。

  • 在失败的数据集中,约 19% 遭受了 LeRobot issue 2401 中识别出的 episode-frame 损坏(v2.1 到 v3.0)。
  • 约 3% 的故障是由时间戳浮点漂移引起的,与 LeRobot issue 3177 有关。
  • 该工具可通过 `pip install trajlens` 获取,并能在不到一分钟内对特定数据集进行 lint。

运行 Trajlens 使维护者能够快速识别其数据是否受到这些已知损坏问题的影响,从而帮助确保开放机器人学习生态系统中的数据质量。