PairCoder introduit un cadre de programmation en paire à deux agents où un Conducteur écrit le code et un Navigateur le réexamine par rapport aux preuves de vérification, en échangeant les rôles lorsque les erreurs persistent. Cette approche pallie la fragilité de l'inférence en un seul passage en ancrant la révision dans la chaîne d'outils pour générer des artéfacts structurés tels que des graphiques et des modèles CAO.

  • Évalué sur 17 benchmarks publics et sept modèles de trois fournisseurs.
  • Amélioration de l'exécutabilité des scènes Blender de 0,20 à 0,78.
  • Augmentation du taux de compilation TikZ de 10 à 30 points pour chaque modèle.
  • Fonctionne à un coût de 2,9 à 9,2 fois celui de l'inférence par modèle unique, en moyenne environ 7 fois plus élevé.

La méthode offre une recette fiable pour la génération vérifiée pilotée par du code, particulièrement lorsque la chaîne d'outils fournit un oracle informatif.