llama.cpp b9848 版本修复了 CUDA get_rows_back 问题并提供二进制文件

llama.cpp 项目发布了 b9848 版本，其中包含对 CUDA 后端的紧急修复，以解决行数超过 65535 的表上 `get_rows_back` 函数的问题。此更新解决了之前影响大型表操作的 grid-y 钳位和步长错误。

通过修正 grid-y 钳位和步长逻辑，修复了 CUDA `get_rows_back` 在行数超过 65535 的表上的问题（PR #25103）。
此版本中禁用了 macOS Apple Silicon KleidiAI 支持。
openEuler 标准构建已禁用，但 x86 (310p, 910b ACL Graph) 和 aarch64 (310p, 910b ACL Graph) 的特定构建仍然可用。
提供了适用于 macOS (Apple Silicon arm64 和 Intel x64)、Linux (Ubuntu CPU、Vulkan、ROCm 7.2、OpenVINO、SYCL FP32/FP16)、Android (arm64 CPU)、Windows (CPU、OpenCL Adreno、CUDA 12/13、Vulkan、OpenVINO、SYCL、HIP) 以及独立 UI 的二进制文件。

此版本确保了处理大型数据结构的 CUDA 用户的稳定性，并在主要操作系统和硬件加速器上提供了全面的预构建二进制文件。