llama.cpp b9855 リリースで AVX2 nvfp4 最適化と新しいバイナリが追加

llama.cpp プロジェクトはバージョン b9855 をリリースしました。これは、ggml-cpu バックエンド内で UE4M3 ルックアップテーブル (LUT) を使用した nvfp4 ドット積の AVX2 最適化を導入しています。

macOS Apple Silicon および Intel ビルドが、iOS XCFramework とともに提供されています。
Linux バイナリは、CPU、Vulkan、ROCm 7.2、OpenVINO、SYCL (FP32/FP16) を介して Ubuntu x64、arm64、s390x アーキテクチャをサポートしています。
Windows リリースには、CPU、OpenCL Adreno、CUDA 12.4 および 13.3、Vulkan、OpenVINO、SYCL、HIP のバックエンドが含まれています。
Android arm64 CPU バイナリがモバイルデプロイメント用に提供されています。
このリリースでは、macOS Apple Silicon での KleidiAI サポートが無効になっています。

このアップデートにより、特定のハードウェア構成向けに最適化された推論機能が提供され、主要なオペレーティングシステム全体でサポートされるアクセラレーターの範囲が拡大しました。