llama.cpp の b9859 リリースは、OpenCL 用のプリコンパイル済みバイナリカーネルをライブラリからロードする機能を導入し、特に Adreno GPU を対象としています。このアップデートでは、CPU、GPU、および各種アクセラレータバックエンドに対して、macOS、Linux、Windows、Android、openEuler のバイナリも提供されます。
- 循環依存関係を解決するために ggml-backend-dl を介してバイナリカーネルライブラリのロードを可能にします。
- カーネルライブラリから gemm_moe_mxfp4_f32_ns、q8_0、q4_0、q4_1、および q4_k moe gemm などの特定のカーネルをロードします。
- OpenCL Adreno サポートに対して get_adreno_bin_kernel_func_t を常に宣言します。
- このリリースでは、KleidiAI を備えた macOS Apple Silicon は無効化されています。
この強化により、プリコンパイル済みバイナリカーネルを有効にすることで OpenCL パフォーマンスが向上し、幅広いハードウェアプラットフォームとの互換性が維持されます。