PairCoder introduce un marco de programación en par con dos agentes donde un Driver escribe código y un Navigator lo revisa frente a evidencia de verificación, intercambiando roles cuando persisten los errores. Este enfoque aborda la fragilidad de la inferencia de un solo paso al fundamentar la revisión en la cadena de herramientas para generar artefactos estructurados como gráficos y modelos CAD.
- Evaluado en 17 benchmarks públicos y siete modelos de tres proveedores.
- Mejora la ejecutabilidad de escenas de Blender de 0.20 a 0.78.
- Aumenta la tasa de compilación de TikZ entre 10 y 30 puntos en cada modelo.
- Opera con un costo de 2.9 a 9.2 veces el de la inferencia de un solo modelo, promediando alrededor de 7 veces en general.
El método proporciona una receta confiable para la generación verificada impulsada por código, particularmente donde la cadena de herramientas ofrece un oráculo informativo.