llama.cpp 项目发布了 b9867 版本,在 DFlash 中引入了对 spec-draft-p-min 规范的支持。此更新包括代码更改以添加 n_min 保护,并确保 n_min 和 n_max 都得到正确保护。

  • 通过 pull request #25246 在 DFlash 中支持 spec-draft-p-min。
  • 在 dflash 模块中添加 n_min 保护。
  • 对 n_min 和 n_max 参数进行保护。
  • 提供 macOS Apple Silicon (arm64) 二进制文件,同时禁用 KleidiAI 支持。
  • Linux 构建适用于 Ubuntu x64/arm64/s390x,包含 CPU、Vulkan、ROCm 7.2、OpenVINO 和 SYCL 后端。
  • 发布 Android arm64 (CPU) 二进制文件。
  • Windows x64/arm64 构建支持 CPU、OpenCL Adreno、CUDA 12/13、Vulkan、OpenVINO、SYCL 和 HIP。
  • openEuler x86 和 aarch64 构建适用于 310p 和 910b (ACL Graph)。

此发布版提供了跨多个平台和硬件加速器的更新二进制文件,使用户能够在新 DFlash 规范支持下运行 llama.cpp。