QuantVectors recherche des jeux de données de documents annotés en langues indiques d'Inde, y compris le hindi, le marathi, le gujarati, le bengali, le pendjabi, le tamoul, l'ourdou, le télougou, l'odia, le kannada, le malayalam et l'assamais. Les jeux de données doivent inclure des types tels que factures, reçus, factures de services publics, avis de paiement, listes de colisage, factures commerciales et notes de crédit, avec environ 400 documents par langue, des annotations vérifiées par un humain et une précision de 99 %+. Les jeux de données doivent être sous licence commerciale et peuvent être open-source ou commerciaux, avec une demande de jeux de données HuggingFace, de jeux de données de recherche ou de fournisseurs spécialisés dans ce domaine.
Recherche de jeux de données de documents en langues indiques pour l'entraînement IA/OCR en Inde
Traduit de English → Français