llama.cpp 项目发布了 b9870 版本,其中包括对由 StepFun 解析器引起的长推理循环的修复。该更新将消息修剪逻辑移至渲染之前,以正确处理内容部分和空白。
- 通过在渲染前修剪发送给 StepFun 解析器的消息来修复长推理循环。
- 对 content_parts 文本、字符串内容和 reasoning_content 应用修剪。
- 为内容部分添加回归测试并删除重复的模板。
- 禁用 macOS Apple Silicon (arm64, KleidiAI enabled) 构建。
此版本为 macOS、Linux、Windows、Android 和 openEuler 在各种 CPU 和 GPU 后端提供了更新的二进制文件,确保支持平台上的用户可以使用解析器修复。