Koshur Pixel представляет синтетический набор данных для распознавания текста, содержащий 613 078 пар изображений и текста, сгенерированных на основе корпуса KS-PRET-5M с использованием SynthOCR-Gen. В наборе присутствуют более 25 стратегий усилений и охватывают разнообразные шрифты и масштабы текста, от слов до полных документов, что позволяет масштабируемо обучать системы распознавания текста на кашмирском языке.
Koshur Pixel: Первый масштабный синтетический набор данных для распознавания текста на кашмирском языке
Переведено с English → Русский