Proyek llama.cpp telah merilis versi b9848, yang mencakup perbaikan kritis untuk backend CUDA guna menyelesaikan masalah dengan fungsi `get_rows_back` pada tabel yang melebihi 65535 baris. Pembaruan ini mengatasi kesalahan pengikatan grid-y dan stride yang sebelumnya memengaruhi operasi tabel besar.

  • Memperbaiki CUDA `get_rows_back` untuk tabel dengan lebih dari 65535 baris dengan memperbaiki logika clamp grid-y dan stride (PR #25103).
  • Dukungan macOS Apple Silicon KleidiAI DINONAKTIFKAN dalam rilis ini.
  • Build standar openEuler DINONAKTIFKAN, tetapi build khusus untuk x86 (310p, 910b ACL Graph) dan aarch64 (310p, 910b ACL Graph) tetap tersedia.
  • Biner disediakan untuk macOS (Apple Silicon arm64 dan Intel x64), Linux (Ubuntu CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16), Android (arm64 CPU), Windows (CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP), dan UI mandiri.

Rilis ini memastikan stabilitas bagi pengguna CUDA yang menangani struktur data besar sambil menawarkan biner pra-bangun yang komprehensif di berbagai sistem operasi utama dan akselerator perangkat keras.