В данной статье рассматривается проблема разрешения сущностей в больших наборах данных с использованием оракула, который группирует записи ограниченными пакетами, стремясь к модели оплаты по факту использования для контроля затрат при максимизации полноты.

  • Проблема формально сформулирована как пакетное разрешение сущностей, и доказано, что выбор оптимальных пакетов является NP-трудной задачей.
  • Оптимальное решение предложено при естественном условии известных размеров сущностей.
  • Предложенный подход оценен на шести наборах данных, демонстрируя превосходство над современными базовыми методами.