Proyek llama.cpp telah merilis versi b9844, yang memperkenalkan dukungan ggml-webgpu untuk format kuantisasi NVFP4. Pembaruan ini juga menyediakan biner pra-dibangun untuk macOS, iOS, Linux, Android, Windows, dan openEuler di berbagai backend perangkat keras.

  • Menambahkan dukungan NVFP4 ke ggml-webgpu melalui pull request #25143.
  • Menonaktifkan build KleidiAI untuk macOS Apple Silicon dan openEuler dalam rilis ini.
  • Menyediakan biner untuk Ubuntu (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16), Windows (CPU, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP), dan Android arm64.
  • Merilis biner macOS Apple Silicon (arm64 dan x64) bersama dengan iOS XCFramework.
  • Termasuk biner UI untuk penggunaan umum.

Rilis ini memungkinkan pengembang memanfaatkan kuantisasi NVFP4 pada perangkat WebGPU sambil menawarkan eksekutabel pra-dibangun yang diperbarui untuk berbagai sistem operasi dan arsitektur GPU.