Исследователи представляют модульный, полностью открытый по весам конвейер для многоязычного совместного извлечения сущностей и отношений, который строит знаковые временные графы знаний на основе массивных неструктурированных корпусов новостей. Система объединяет распознавание именованных сущностей на основе спанов с каскадом связывания с Wikidata и моделью смеси экспертов, ограниченной онтологией, для извлечения направленных отношений.

  • Конвейер использует управляемое декодирование для извлечения направленных знаковых отношений, основанных на предметной онтологии.
  • Выборочная проверка против золотого стандарта из 3491 отношения показала текстовую корректность в диапазоне от 68,2% по строгой оценке до 93,7% по мягкой.
  • В Австрии инструмент реконструировал жизненный цикл политической партии, отслеживая переход персонала в фракции-преемники и судебные приговоры.
  • В Польше он выявил пересекающиеся экономические и управленческие сети патронажа государственных предприятий, а также сеть конфликтов между партиями ПО и ПиС.

Связывая сырой многоязычный текст со структурированными реляционными данными, эта рамка обеспечивает надежную, воспроизводимую основу для кросс-национальной эмпирической вычислительной социальной науки.