llama.cpp 项目发布了 b9848 版本,其中包含对 CUDA 后端的紧急修复,以解决行数超过 65535 的表上 `get_rows_back` 函数的问题。此更新解决了之前影响大型表操作的 grid-y 钳位和步长错误。
- 通过修正 grid-y 钳位和步长逻辑,修复了 CUDA `get_rows_back` 在行数超过 65535 的表上的问题(PR #25103)。
- 此版本中禁用了 macOS Apple Silicon KleidiAI 支持。
- openEuler 标准构建已禁用,但 x86 (310p, 910b ACL Graph) 和 aarch64 (310p, 910b ACL Graph) 的特定构建仍然可用。
- 提供了适用于 macOS (Apple Silicon arm64 和 Intel x64)、Linux (Ubuntu CPU、Vulkan、ROCm 7.2、OpenVINO、SYCL FP32/FP16)、Android (arm64 CPU)、Windows (CPU、OpenCL Adreno、CUDA 12/13、Vulkan、OpenVINO、SYCL、HIP) 以及独立 UI 的二进制文件。
此版本确保了处理大型数据结构的 CUDA 用户的稳定性,并在主要操作系统和硬件加速器上提供了全面的预构建二进制文件。