Rilis llama.cpp b9844 menambahkan dukungan NVFP4 dan biner baru

Proyek llama.cpp telah merilis versi b9844, yang memperkenalkan dukungan ggml-webgpu untuk format kuantisasi NVFP4. Pembaruan ini juga menyediakan biner pra-dibangun untuk macOS, iOS, Linux, Android, Windows, dan openEuler di berbagai backend perangkat keras.

Menambahkan dukungan NVFP4 ke ggml-webgpu melalui pull request #25143.
Menonaktifkan build KleidiAI untuk macOS Apple Silicon dan openEuler dalam rilis ini.
Menyediakan biner untuk Ubuntu (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16), Windows (CPU, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP), dan Android arm64.
Merilis biner macOS Apple Silicon (arm64 dan x64) bersama dengan iOS XCFramework.
Termasuk biner UI untuk penggunaan umum.

Rilis ini memungkinkan pengembang memanfaatkan kuantisasi NVFP4 pada perangkat WebGPU sambil menawarkan eksekutabel pra-dibangun yang diperbarui untuk berbagai sistem operasi dan arsitektur GPU.