PairCoder introduz um framework de programação em par com dois agentes onde um Driver escreve o código e um Navigator o revisa contra evidências de verificação, alternando papéis quando os erros persistem. Esta abordagem aborda a fragilidade da inferência de passagem única ao fundamentar a revisão na toolchain para gerar artefatos estruturados como gráficos e modelos CAD.

  • Avaliado em 17 benchmarks públicos e sete modelos de três fornecedores.
  • Melhorou a executabilidade de cenas do Blender de 0.20 para 0.78.
  • Aumentou a taxa de compilação do TikZ em 10 a 30 pontos em cada modelo.
  • Opera com custo de 2,9 a 9,2 vezes o da inferência de modelo único, em média cerca de 7 vezes no geral.

O método fornece uma receita confiável para geração orientada por código verificada, particularmente onde a toolchain oferece um oráculo informativo.