Los investigadores presentan una canalización modular y completamente de peso abierto para la extracción conjunta multilingüe de entidades y relaciones que construye grafos de conocimiento temporales y firmados a partir de grandes corpus de noticias no estructuradas. El sistema combina reconocimiento de entidades nombradas basado en intervalos con una cascada de vinculación a Wikidata y un modelo de mezcla de expertos restringido por ontología para extraer relaciones dirigidas.

  • La canalización utiliza decodificación guiada para extraer relaciones dirigidas y firmadas fundamentadas en una ontología de dominio.
  • Una verificación puntual frente a un estándar dorado de 3491 relaciones mostró corrección textual que oscila entre el 68,2% estricto y el 93,7% indulgente.
  • En Austria, la herramienta reconstruyó el ciclo vital de un partido político, rastreando al personal hacia facciones sucesoras y condenas judiciales.
  • En Polonia, descubrió redes económicas y de gobernanza superpuestas de patrocinio entre el Estado y las empresas, así como la red de conflictos entre los partidos PO y PiS.

Al conectar texto multilingüe sin procesar con datos relacionales estructurados, este marco proporciona una base robusta y replicable para la ciencia social computacional empírica transnacional.