В данном исследовании предлагается фреймворк на уровне предложений для выявления, анализа и отслеживания эволюции мотивов упоминания алгоритмов в научных статьях, используя обработку естественного языка в качестве примера. Исследователи классифицируют эти мотивы с помощью предварительно обученных моделей и аугментации данных, показывая, что модели глубокого обучения превосходят традиционные подходы машинного обучения.

  • Модели глубокого обучения, обученные на аугментированных данных, демонстрируют более высокую производительность в классификации мотивов по сравнению с традиционными моделями машинного обучения.
  • В статьях по NLP более половины предложений, связанных с алгоритмами, выражают прямое использование, тогда как улучшение является наименее частым мотивом.
  • Грамматические алгоритмы чаще упоминаются для описания, в то время как алгоритмы машинного обучения чаще цитируются для использования.
  • Мотивы использования постепенно заменили мотивы описания с течением времени, а количество типов мотивов, связанных с отдельными алгоритмами, значительно сократилось.

Полученные результаты создают основу для будущих исследований по выявлению связей между алгоритмами и оценке их влияния, раскрывая то, как авторы упоминают сущности алгоритмов в академических текстах.