Исследователи предлагают TIGRAG (Token-Induced GraphRAG) — фреймворк, использующий статистику совместной встречаемости токенов для построения масштабируемых графов знаний с целью эффективного извлечения с дополнением. Этот подход устраняет ограничения стандартного RAG в задачах многошагового рассуждения за счёт отказа от дорогостоящих конвейеров извлечения на основе LLM.
TIGRAG строит графы с использованием скользящего окна и статистики совместной встречаемости, что позволяет масштабировать построение графов без сложных этапов извлечения. Система комбинирует семантическое расширение на основе графов и нейронное перечисление для получения взаимосвязанных доказательств в задачах многошагового рассуждения. Она внедряет итеративную стратегию извлечения, управляемую сущностями, которая постепенно расширяет запросы с помощью связующих сущностей из ранее полученных контекстов.
Экспериментальные результаты на трёх бенчмарках для многошагового ответа на вопросы показывают, что TIGRAG стабильно превосходит методы плотного извлечения и графового RAG как в задачах извлечения, так и в последующих этапах, одновременно сокращая время индексации, задержку вывода и размер промпта.