Двойное доверие контрастивного декодирования улучшает многодокументный RAG за счёт разрешения внутриконтекстных конфликтов

Исследователи предлагают метод Dual-Confidence Contrastive Decoding (DCCD), не требующий обучения, предназначенный для решения внутриконтекстных конфликтов в retrieval-augmented generation, где извлечённые документы содержат устаревшие, зашумлённые или противоречивые доказательства. Подход объединяет уверенность на уровне документа, которая оценивает достаточность источника для ответа, с уверенностью на уровне токена, которая оценивает поддержку предсказаний следующего токена.

DCCD выбирает положительные и отрицательные потоки, обусловленные документом, используя эти сигналы двойной уверенности, и масштабирует контраст по их разнице.
Для оценки этого подхода авторы вводят DRQA, бенчмарк фактологически противоречивых вопросов, полученный из сценариев корпоративного глубокого исследования с синтетическими фактами.
В тестах DRQA и стандартных многодокументных QA-бенчмарках DCCD достигает наилучшей средней производительности среди базовых методов полного контекста и контрастивного декодирования.

Эти результаты подчёркивают важность декодирования, учитывающего источник и управляемого уверенностью, когда извлечённые доказательства внутренне противоречивы.