연구원들은 검색된 문서에 낡고, 노이즈가 많거나, 상충되는 증거가 포함된 retrieval-augmented generation의 문맥 내 갈등을 해결하도록 설계된 학습 없는 방법인 Dual-Confidence Contrastive Decoding (DCCD)를 제안합니다. 이 접근 방식은 소스가 답변에 충분한지 추정하는 문서 수준 신뢰도와 다음 토큰 예측에 대한 지지를 평가하는 토큰 수준 신뢰도를 결합합니다.
- DCCD는 이러한 이중 신뢰도 신호를 사용하여 양수 및 음수 문서 조건부 스트림을 선택하고 마진에 따라 대비를 스케일링합니다.
- 이 설정을 평가하기 위해 저자들은 합성 사실을 포함하는 엔터프라이즈 딥 리서치 시나리오에서 파생된 사실적 갈등 질문 응답 벤치마크인 DRQA를 도입했습니다.
- DRQA 및 표준 다중 문서 QA 벤치마크 전반에 걸쳐 DCCD는 전체 컨텍스트 및 대비 디코딩 기반선 중 최고의 평균 성능을 달성합니다.
이러한 결과는 검색된 증거가 내부적으로 상충될 때 소스 인식형 신뢰도 게이트 디코딩의 중요성을 강조합니다.