QuantVectors ищет аннотированные наборы документов на индийских языках из Индии, включая хинди, маратхи, гуджарати, бенгали, панjabi, тамильский, урду, телугу, оди, каннада, мальяли и ассамский. Наборы должны включать типы документов: счет-фактура, чек, счет-счет, рекомендация по оплате, список упаковки, коммерческий счет-фактура и кредитный документ, приблизительно 400 документов на язык, аннотации, проверенные людьми, и точность не менее 99%. Наборы должны быть коммерчески лицензируемыми и могут быть либо открытого доступа, либо коммерческими, с запросом к наборам на HuggingFace, научным наборам данных или поставщикам, специализирующимся в этой области.
Поиск наборов документов для обучения ИИ/OCR на индийских языках в Индии
Переведено с English → Русский