लेखक ने Hugging Face Hub पर LeRobotDataset श्रेणी के लिए Trajlens, एक ओपन-सोर्स लिंटर का परिचय दिया है, और 'lerobot' टैग वाले 100 यादृच्छिक सार्वजनिक डेटासेट की ऑडिट से प्राप्त परिणामों की रिपोर्ट की है। ऑडिट ने दिखाया कि केवल 19 डेटासेट वैलिडेशन में पास हुए, जबकि 13 विशिष्ट अपस्ट्रीम बग्स के कारण विफल रहे और 47 लोड त्रुटियों या टाइमआउट का सामना किया।

  • विफल डेटासेट में से, लगभग 19% को LeRobot इश्यू 2401 में पहचाने गए एपिसोड-फ्रेम क्षरण (v2.1 से v3.0) का सामना करना पड़ा।
  • विफलताओं का लगभग 3% टाइमस्टैम्प फ्लोट ड्रिफ्ट के कारण हुआ, जो LeRobot इश्यू 3177 से जुड़ा है।
  • उपकरण `pip install trajlens` के माध्यम से उपलब्ध है और एक विशिष्ट डेटासेट को एक मिनट से भी कम समय में लिनट कर सकता है।

Trajlens चलाने से रखरखावकर्ताओं को यह तुरंत पहचानने में मदद मिलती है कि क्या उनका डेटा इन ज्ञात क्षरण समस्याओं से प्रभावित है, जो खुले रोबोट-सीखने पारिस्थितिकी तंत्र के भीतर डेटा गुणवत्ता को सुनिश्चित करने में मदद करता है।