llama.cpp 项目已发布 b9843 版本,为 macOS、Linux、Android、Windows 和 openEuler 在各种硬件架构上提供预构建的二进制文件。

  • 还原 PR #20793,以在拆分计算期间重新引入较少的同步操作。
  • 禁用 macOS Apple Silicon 构建的 KleidiAI 支持。
  • 为 Linux 和 Windows 提供 CPU、Vulkan、ROCm、OpenVINO、SYCL、CUDA、HIP 和 OpenCL 变体。
  • 包含 iOS XCFramework、Android arm64 (CPU) 和 UI 二进制文件。

此版本允许用户在各种设备和加速器上运行 llama.cpp,而无需从源代码编译。