llama.cpp 版本 b9714 向流式传输端点添加了 "X-Accel-Buffering": "no" 头,以防止 Nginx 缓冲响应,从而解决了 Pi 编码工具等应用程序的流式传输问题。该发布版包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构和硬件加速选项。