Armin Ronacher rapporte que les derniers modèles Claude d'Anthropic, spécifiquement Opus 4.8 et Sonnet 5, produisent des appels d'outils malformés lors de l'interaction avec le harnais de codage Pi. Les modèles inventent des champs supplémentaires dans le tableau d'édition imbriqué qui ne correspondent pas au schéma attendu, ce qui amène Pi à rejeter l'appel.

  • Les nouveaux modèles SOTA comme Opus 4.8 et Sonnet 5 présentent cette régression, tandis que les anciens modèles ne le font pas.
  • Le problème provient du fait que les modèles ont été entraînés à utiliser les outils d'édition intégrés de Claude Code, ce qui nuit à la compatibilité avec les harnais tiers.
  • Cela contraste avec Codex d'OpenAI, qui utilise un mécanisme apply_patch différent conçu pour une utilisation efficace des outils.

L'article suggère que les harnais de codage tiers pourraient devoir implémenter plusieurs outils d'édition pour garantir des performances correctes sur différents modèles sous-jacents.