Исследователи предлагают метод Dual-Confidence Contrastive Decoding (DCCD), не требующий обучения, предназначенный для решения внутриконтекстных конфликтов в retrieval-augmented generation, где извлечённые документы содержат устаревшие, зашумлённые или противоречивые доказательства. Подход объединяет уверенность на уровне документа, которая оценивает достаточность источника для ответа, с уверенностью на уровне токена, которая оценивает поддержку предсказаний следующего токена.
- DCCD выбирает положительные и отрицательные потоки, обусловленные документом, используя эти сигналы двойной уверенности, и масштабирует контраст по их разнице.
- Для оценки этого подхода авторы вводят DRQA, бенчмарк фактологически противоречивых вопросов, полученный из сценариев корпоративного глубокого исследования с синтетическими фактами.
- В тестах DRQA и стандартных многодокументных QA-бенчмарках DCCD достигает наилучшей средней производительности среди базовых методов полного контекста и контрастивного декодирования.
Эти результаты подчёркивают важность декодирования, учитывающего источник и управляемого уверенностью, когда извлечённые доказательства внутренне противоречивы.