llama.cpp 项目已发布 b9822 版本,提供了适用于 macOS、iOS、Linux、Android 和 Windows 的预构建二进制文件。此更新修复了 test-chat-template --no-common 选项的问题,并在各种硬件架构和加速器上分发构建版本。

  • macOS Apple Silicon (arm64) 和 Intel (x64) 二进制文件可用,KleidiAI 支持已禁用。
  • Linux 构建涵盖 Ubuntu x64 和 arm64 CPU、s390x CPU、Vulkan、ROCm 7.2、OpenVINO 以及 SYCL FP32/FP16。
  • Windows 版本包括 CPU、OpenCL Adreno、CUDA 12.4 和 13.3、Vulkan、OpenVINO、SYCL 和 HIP 变体。
  • 分发版中包含 Android arm64 (CPU) 二进制文件和 iOS XCFramework。
  • 列出了适用于 x86 和 aarch64 架构的 openEuler 构建,部分配置已禁用。

该版本使用户能够在不编译源代码的情况下,在广泛的各种设备和 GPU 加速器上运行 llama.cpp。