Este estudio propone un marco a nivel de oración para identificar, analizar y rastrear la evolución de las motivaciones para mencionar algoritmos en artículos académicos, utilizando el procesamiento del lenguaje natural como caso de estudio. Los investigadores clasifican estas motivaciones mediante modelos preentrenados y aumento de datos, revelando que los modelos de aprendizaje profundo superan a los enfoques tradicionales de aprendizaje automático.
- Los modelos de aprendizaje profundo entrenados con datos aumentados logran un rendimiento superior al de los modelos tradicionales de aprendizaje automático en la clasificación de motivaciones.
- En artículos de PLN, más de la mitad de las oraciones relacionadas con algoritmos expresan uso directo, mientras que la mejora es la motivación menos frecuente.
- Los algoritmos basados en gramática se mencionan con mayor frecuencia para descripción, mientras que los algoritmos de aprendizaje automático se citan con mayor frecuencia para uso.
- Las motivaciones de uso han reemplazado gradualmente a las motivaciones de descripción con el tiempo, y el número de tipos de motivación asociados con algoritmos individuales ha disminuido significativamente.
Los hallazgos proporcionan una base para futuras investigaciones sobre la identificación de relaciones entre algoritmos y la evaluación del impacto de los algoritmos al revelar cómo los autores mencionan entidades algorítmicas en la escritura académica.