Armin Ronacher informa que los últimos modelos de Claude de Anthropic, específicamente Opus 4.8 y Sonnet 5, están produciendo llamadas a herramientas malformadas al interactuar con el entorno de codificación Pi. Los modelos inventan campos adicionales en la matriz de ediciones anidadas que no coinciden con el esquema esperado, lo que hace que Pi rechace la llamada.
- Los modelos SOTA más recientes como Opus 4.8 y Sonnet 5 exhiben esta regresión, mientras que los modelos antiguos no lo hacen.
- El problema radica en que los modelos fueron entrenados para usar las herramientas de edición integradas de Claude Code, lo que perjudica la compatibilidad con entornos de terceros.
- Esto contrasta con Codex de OpenAI, que utiliza un mecanismo apply_patch diferente diseñado para un uso efectivo de herramientas.
El artículo sugiere que los entornos de codificación de terceros pueden necesitar implementar múltiples herramientas de edición para garantizar un rendimiento correcto en diferentes modelos subyacentes.