Este estudio analiza el desarrollo de tecnologías en Procesamiento de Lenguaje Natural (NLP) desde una perspectiva centrada en entidades, extrayendo métodos, conjuntos de datos, métricas y herramientas para medir su impacto mediante redes de co-ocurrencia. La investigación revela que, aunque los modelos de lenguaje preentrenados como BERT y Transformer se han vuelto predominantes, el número promedio de entidades por artículo está aumentando, lo que indica una carga de conocimiento creciente para los investigadores.

  • El estudio extrae entidades relacionadas con la tecnología de artículos de NLP y las normaliza utilizando un enfoque semiautomático para calcular puntuaciones z basadas en redes de co-ocurrencia.
  • Los métodos dominan entre las 179 entidades de alto impacto identificadas, con modelos de lenguaje preentrenados como BERT y Transformer volviéndose predominantes en los últimos años.
  • A diferencia de otras entidades de método, el impacto del conjunto de datos Wikipedia y la métrica BLEU ha continuado aumentando a largo plazo.
  • Hay un aumento notable en la popularidad de nuevas tecnologías de alto impacto, con su aceptación por parte de los investigadores acelerándose a una velocidad sin precedentes.

Este enfoque proporciona un análisis más preciso de las tendencias de desarrollo tecnológico que las perspectivas temáticas de grano grueso, destacando cómo los modelos preentrenados han inyectado nueva vitalidad en la innovación de NLP.