SciTraj: Grafo de citas tipificado basado en afirmaciones para la evolución de la investigación
SciTraj es el primer corpus de citas tipificado basado en afirmaciones que vincula cada cita con una oración de afirmación específica. Incluye 32,559 artículos de NLP, ML y Visión (2015–2024) con 573,126 aristas dirigidas entre seis tipos de relación, y 287M trayectorias tipificadas de longitud ≥3, cubriendo el 72.8% de los artículos. El corpus permite el análisis del aislamiento disciplinario y la emergencia de temas, con semillas de afirmaciones validadas y un benchmark de predicción de enlaces dividido temporalmente.