llama.cpp プロジェクトはバージョン b9844 をリリースし、NVFP4 量子化形式に対する ggml-webgpu のサポートを導入しました。このアップデートでは、macOS、iOS、Linux、Android、Windows、openEuler 向けに、さまざまなハードウェアバックエンド用のビルド済みバイナリも提供されています。

  • プルリクエスト #25143 を通じて ggml-webgpu に NVFP4 サポートを追加。
  • 今回のリリースでは、macOS Apple Silicon と openEuler 向けの KleidiAI ビルドを無効化。
  • Ubuntu (CPU、Vulkan、ROCm 7.2、OpenVINO、SYCL FP32/FP16)、Windows (CPU、CUDA 12/13、Vulkan、OpenVINO、SYCL、HIP)、Android arm64 向けのバイナリを提供。
  • macOS Apple Silicon (arm64 および x64) 向けバイナリと iOS 用 XCFramework をリリース。
  • 一般利用向けの UI バイナリを含める。

このリリースにより、開発者は WebGPU デバイスで NVFP4 量子化を活用できるようになり、幅広いオペレーティングシステムや GPU アーキテクチャに対応した更新されたビルド済み実行ファイルが提供されます。