تبحث شركة QuantVectors عن مجموعات بيانات وثائقية مُعلَّمة بلغات هندية من الهند، بما في ذلك الهنديّة، والمراثية، والغوجاراتية، والبنغالية، والبنجابية، والتاميلية، والأردية، والتيلوغوية، والأوديا، والكانادا، والماليالامية، والآسامية. يجب أن تتضمن مجموعات البيانات أنواع الفواتير، والإيصالات، وفواتير المرافق، وإشعارات الدفع، وقوائم التعبئة، والفواتير التجارية، وملاحظات الائتمان، مع حوالي 400 وثيقة لكل لغة، وتعليقات مُتحقَّقة من قبل البشر، ودقة بنسبة 99%+. يجب أن تكون مجموعات البيانات قابلة للتراخيص تجاريًا ويمكن أن تكون مفتوحة المصدر أو تجارية، مع طلب مجموعات بيانات على HuggingFace، أو مجموعات بيانات بحثية، أو موردين متخصصين في هذا المجال.