llama.cpp 项目已发布 b9825 版本,其中包含对处理零输入时 Vulkan step 算子的修复。此更新提供了适用于 macOS、Linux、Windows、Android 和 openEuler 的预构建二进制文件,覆盖多种硬件后端。
- macOS Apple Silicon (arm64) 和 Intel (x64) 构建版本可用,已禁用 KleidiAI 支持。
- Linux 二进制文件涵盖 CPU (x64, arm64, s390x)、Vulkan、ROCm 7.2、OpenVINO 和 SYCL FP32/FP16。
- Windows 发布版包括 CPU、OpenCL Adreno、CUDA 12.4 和 13.3、Vulkan、OpenVINO、SYCL 和 HIP 后端。
- 提供 Android arm64 (CPU) 和 iOS XCFramework 构建版本,用于移动设备部署。
- openEuler 支持包括使用 ACL Graph 的 x86 和 aarch64 变体,尽管主拉取请求已标记为禁用。
此发布版确保了在不同操作系统和硬件加速器上的更广泛兼容性,同时修正了特定的 Vulkan 执行错误。