В статье описывается методология цифровизации словаря Al-Mawrid на арабском-английском языке с использованием ISO LMF и TEI Lex-0. Достигается точность структурного парсинга на уровне 91%, а также демонстрируется точность 85% и полнота 98% для синонимов, а также точность 88% для морфосемантических признаков, на основе выборки буквы Айн. В исследовании подчеркиваются ограничения TEI Lex-0 в отражении семантических и морфологических нюансов арабского языка и предлагается масштабируемая система на основе префиксов для интеграции в LLOD.
Кодирование словаря Al-Mawrid с использованием ISO LMF и TEI Lex-0
Переведено с English → Русский