llama.cpp b9848 リリースで CUDA の get_rows_back が修正され、バイナリが提供される

llama.cpp プロジェクトはバージョン b9848 をリリースしました。このバージョンには、65535 行を超えるテーブルにおける `get_rows_back` 関数の問題を解決するための CUDA バックエンドの重要な修正が含まれています。このアップデートは、以前に大規模なテーブル操作に影響を与えていた grid-y クランプおよびストライドのエラーを修正します。

グリッド-y クランプとストライドロジックを修正し、65535 行を超えるテーブルに対する CUDA の `get_rows_back` を修正 (PR #25103)。
このリリースでは macOS Apple Silicon の KleidiAI サポートは無効化されています。
openEuler の標準ビルドは無効化されていますが、x86 (310p, 910b ACL Graph) および aarch64 (310p, 910b ACL Graph) 用の特定のビルドは引き続き利用可能です。
macOS (Apple Silicon arm64 および Intel x64)、Linux (Ubuntu CPU、Vulkan、ROCm 7.2、OpenVINO、SYCL FP32/FP16)、Android (arm64 CPU)、Windows (CPU、OpenCL Adreno、CUDA 12/13、Vulkan、OpenVINO、SYCL、HIP)、およびスタンドアロン UI 用のバイナリが提供されています。

このリリースは、大規模なデータ構造を扱う CUDA ユーザーの安定性を確保しつつ、主要なオペレーティングシステムおよびハードウェアアクセラレーター全体で包括的なプリビルドバイナリを提供します。