Rilis b9814 llama.cpp dengan optimasi Vulkan untuk mi50

Proyek llama.cpp telah merilis versi b9814, yang mencakup optimasi untuk operasi `mul_mat_vecq` di Vulkan yang secara khusus menargetkan GPU AMD mi50. Pembaruan ini disertai dengan sekumpulan lengkap biner pra-dibangun di berbagai sistem operasi dan arsitektur perangkat keras.

Build macOS Apple Silicon (arm64) dan Intel (x64) tersedia, dengan dukungan KleidiAI dinonaktifkan untuk Apple Silicon.
Biner Linux mencakup Ubuntu x64 dan arm64 CPU, Vulkan, ROCm 7.2, OpenVINO, dan varian SYCL FP32/FP16.
Rilis Windows mencakup backend CPU, OpenCL Adreno, CUDA 12.4 dan 13.3, Vulkan, OpenVINO, SYCL, dan HIP.
Build Android arm64 (CPU) dan openEuler x86/aarch64 untuk chip 310p dan 910b disediakan, dengan build standar openEuler x86 dinonaktifkan.

Rilis ini memungkinkan pengguna menjalankan llama.cpp pada berbagai konfigurasi perangkat keras, termasuk optimasi khusus untuk GPU AMD melalui Vulkan.