llama.cpp 项目发布了构建版本 b9871,其中包括对处理量化数据类型时损坏的 CPU 连接实现的修复。
- 核心更改解决了 ggml 中针对量化类型的 CPU concat 逻辑中的错误,并附带了用于验证正确性的新测试。
- 预编译二进制文件适用于 macOS(Apple Silicon 和 Intel)、Linux(Ubuntu x64/arm64/s390x,含 CPU、Vulkan、ROCm 7.2、OpenVINO、SYCL)、Windows(CPU、CUDA 12/13、Vulkan、OpenCL、OpenVINO、SYCL、HIP)、Android arm64 和 openEuler。
- 此版本还包含更新的 UI 二进制文件。