llama.cpp 项目发布了 b9870 版本,其中包含对由 StepFun 解析器引起的长推理循环的修复。此次更新将消息修剪逻辑移至渲染之前,以正确处理内容部分和空白字符。
- 通过在渲染前向 StepFun 解析器发送修剪后的消息来修复长推理循环。
- 对 content_parts 文本、字符串内容和 reasoning_content 应用修剪。
- 为内容部分添加回归测试,并移除重复的模板。
- 禁用 macOS Apple Silicon (arm64, KleidiAI 启用) 构建。
此版本提供了适用于 macOS、Linux、Windows、Android 和 openEuler 的更新二进制文件,涵盖各种 CPU 和 GPU 后端,确保支持平台上的用户能够获得该解析器修复。