llama.cpp 项目已发布 b9835 版本,其中包含对单模型模式下停止和推理跳过功能的修复。此更新解决了用户界面中的特定问题,以改进模型推理期间的控制。

  • macOS:提供适用于 Apple Silicon (arm64) 和 Intel (x64) 的二进制文件,Apple Silicon 上禁用了 KleidiAI;包含 iOS XCFramework。
  • Linux:提供适用于 Ubuntu x64 和 arm64(CPU、Vulkan、ROCm 7.2、OpenVINO、SYCL FP32/FP16)的构建版本。
  • Android:提供适用于 arm64 架构的 CPU 二进制文件。
  • Windows:提供适用于 x64 和 arm64 CPU 的二进制文件,以及通过 CUDA 12/13、Vulkan、OpenCL Adreno、OpenVINO、SYCL 和 HIP 支持的 GPU。
  • openEuler:提供适用于 x86 (310p, 910b ACL Graph) 和 aarch64 (310p, 910b ACL Graph) 的构建版本,禁用了标准支持。

该发布版本确保了在多个操作系统和加速器上的更广泛的硬件兼容性,同时修正了单模型场景下的 UI 行为。