Le Décodage Contrastif à Double Confiance améliore le RAG multi-documents en résolvant les conflits intra-contexte

Les chercheurs proposent le Dual-Confidence Contrastive Decoding (DCCD), une méthode sans entraînement conçue pour adresser les conflits intra-contexte dans la génération augmentée par récupération, où les documents récupérés contiennent des preuves périmées, bruitées ou conflictuelles. L'approche combine la confiance au niveau du document, qui estime si une source est suffisante pour répondre, avec la confiance au niveau du token, qui évalue le soutien aux prédictions du prochain token.

Le DCCD sélectionne des flux conditionnés par le document positifs et négatifs à l'aide de ces signaux de double confiance et met à l'échelle le contraste par leur marge.
Pour évaluer ce paramétrage, les auteurs introduisent DRQA, un benchmark de réponse aux questions sur les conflits factuels dérivé de scénarios de recherche approfondie en entreprise avec des faits synthétiques.
Sur DRQA et les benchmarks standard de QA multi-documents, le DCCD atteint la meilleure performance moyenne parmi les bases de référence à contexte complet et au décodage contrastif.

Ces résultats soulignent l'importance du décodage conditionné par la confiance et conscient de la source lorsque les preuves récupérées sont internement conflictuelles.