llama.cpp 项目已发布 b9838 版本,提供适用于多种操作系统和硬件加速器的预编译二进制文件。此版本支持在 macOS、Linux、Windows、Android 和 openEuler 上运行 CPU、GPU(CUDA、Vulkan、ROCm、OpenCL)以及专用 AI 加速器。
- macOS 构建版适用于 Apple Silicon (arm64) 和 Intel (x64),已禁用 KleidiAI 支持。
- Linux 二进制文件提供 Ubuntu x64、arm64 和 s390x 架构版本,包括 CPU、Vulkan、ROCm 7.2、OpenVINO 和 SYCL 变体。
- Windows 发布版包含适用于 x64 和 arm64 的 CPU、CUDA 12/13、Vulkan、OpenCL Adreno、OpenVINO、SYCL 和 HIP 构建。
- Android 支持仅限于 arm64 CPU 构建。
- openEuler 构建版提供 x86 和 aarch64 架构版本,使用 ACL Graph,已禁用标准 openEuler 支持。
此发布使用户能够在无需从源代码编译的情况下,在多样化的硬件配置上部署 llama.cpp。