Theoria는 AI 답변의 감사 가능성을 확보하여 형식 증명 보조 도구와 스칼라 LLM 판정자 간의 격차를 해소하도록 설계된 검증 아키텍처입니다. 이는 후보 솔루션을 인용이나 계산과 같은 명시적인 정당화에 의해 허가된 형식화된 상태 전이의 시퀀스로 재작성합니다.

  • 시스템은 변경의 완결성을 강제하여 연속된 증명 상태 간의 모든 차이를 accounted for 하여 숨겨진 전제를 드러냅니다.
  • HLE-Verified Gold에서 Theoria는 185문제 중 105문제를 엄격한 정밀도 91.4%로 인증합니다.
  • 각 단계를 독립적으로 검증할 수 있는 사람이 읽기 쉬운 증명 추적을 생성합니다.
  • GPQA Diamond에서는 인증된 정밀도가 97.1%에 도달합니다.

이 접근 방식은 사용자에게 불투명한 점수 대신 구조화된 분석을 통해 정확성을 검증할 수 있는 기회를 제공하며, 포괄적인 LLM 판정자에 대한 보완적인 방법을 제시합니다.