PairCoder는 드라이버가 코드를 작성하고 내비게이터가 검증 증거에 따라 이를 검토하며, 오류가 지속될 때 역할을 전환하는 두 에이전트 페어 프로그래밍 프레임워크를 소개합니다. 이 접근 방식은 차트와 CAD 모델과 같은 구조화된 아티팩트를 생성하는 도구 체인에 기반한 검토를 통해 단일 패스 추론의 취약함을 해결합니다.

  • 세 벤더의 일곱 모델과 17개 공개 벤치마크에서 평가되었습니다.
  • Blender 장면 실행 가능성을 0.20에서 0.78로 향상시켰습니다.
  • 모든 모델에서 TikZ 컴파일률을 10~30포인트 증가시켰습니다.
  • 단일 모델 추론 비용의 2.9배에서 9.2배 수준으로 작동하며, 전체적으로 평균 약 7배입니다.

이 방법은 특히 도구 체인이 정보 제공 오라클을 제공할 때 검증된 코드 기반 생성에 대한 신뢰할 수 있는 레시피를 제공합니다.