Armin Ronacher 报告称,Anthropic 的最新 Claude 模型(具体为 Opus 4.8 和 Sonnet 5)在与 Pi 编码框架交互时产生了格式错误的工具调用。这些模型在嵌套编辑数组中添加了额外的字段,与预期模式不匹配,导致 Pi 拒绝该调用。
- 较新的 SOTA 模型如 Opus 4.8 和 Sonnet 5 表现出这种回归,而旧模型则没有。
- 问题源于模型被训练去使用 Claude Code 内置的编辑工具,这损害了与第三方框架的兼容性。
- 这与 OpenAI 的 Codex 形成对比,后者使用了专为有效工具使用设计的不同 apply_patch 机制。
文章建议,第三方编码框架可能需要实现多种编辑工具,以确保在不同底层模型上表现正确。