llama.cpp プロジェクトはバージョン b9855 をリリースしました。これは、ggml-cpu バックエンド内で UE4M3 ルックアップテーブル (LUT) を使用した nvfp4 ドット積の AVX2 最適化を導入しています。
- macOS Apple Silicon および Intel ビルドが、iOS XCFramework とともに提供されています。
- Linux バイナリは、CPU、Vulkan、ROCm 7.2、OpenVINO、SYCL (FP32/FP16) を介して Ubuntu x64、arm64、s390x アーキテクチャをサポートしています。
- Windows リリースには、CPU、OpenCL Adreno、CUDA 12.4 および 13.3、Vulkan、OpenVINO、SYCL、HIP のバックエンドが含まれています。
- Android arm64 CPU バイナリがモバイルデプロイメント用に提供されています。
- このリリースでは、macOS Apple Silicon での KleidiAI サポートが無効になっています。
このアップデートにより、特定のハードウェア構成向けに最適化された推論機能が提供され、主要なオペレーティングシステム全体でサポートされるアクセラレーターの範囲が拡大しました。