llama.cpp 项目发布了版本 b9874,引入了用于连接量化类型的新 CUDA 实现。此更新是库后端功能持续开发的一部分。
- 主要代码更改涉及添加对连接量化数据类型的 CUDA 支持。
- 该版本包括适用于 macOS(Apple Silicon 和 Intel)、Linux(CPU、Vulkan、ROCm、OpenVINO、SYCL)、Android、Windows(CPU、OpenCL、CUDA 12/13、Vulkan、OpenVINO、SYCL、HIP)和 openEuler 的二进制文件。
- 此版本还提供了 iOS XCFramework 和独立 UI 构建。
此更新使用户能够访问 b9874 构建中可用的最新功能和平台支持。