Rilis b9848 llama.cpp memperbaiki get_rows_back CUDA dan menyediakan biner

Proyek llama.cpp telah merilis versi b9848, yang mencakup perbaikan kritis untuk backend CUDA guna menyelesaikan masalah dengan fungsi `get_rows_back` pada tabel yang melebihi 65535 baris. Pembaruan ini mengatasi kesalahan pengikatan grid-y dan stride yang sebelumnya memengaruhi operasi tabel besar.

Memperbaiki CUDA `get_rows_back` untuk tabel dengan lebih dari 65535 baris dengan memperbaiki logika clamp grid-y dan stride (PR #25103).
Dukungan macOS Apple Silicon KleidiAI DINONAKTIFKAN dalam rilis ini.
Build standar openEuler DINONAKTIFKAN, tetapi build khusus untuk x86 (310p, 910b ACL Graph) dan aarch64 (310p, 910b ACL Graph) tetap tersedia.
Biner disediakan untuk macOS (Apple Silicon arm64 dan Intel x64), Linux (Ubuntu CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16), Android (arm64 CPU), Windows (CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP), dan UI mandiri.

Rilis ini memastikan stabilitas bagi pengguna CUDA yang menangani struktur data besar sambil menawarkan biner pra-bangun yang komprehensif di berbagai sistem operasi utama dan akselerator perangkat keras.