llama.cpp の b9859 リリースは、OpenCL 用のプリコンパイル済みバイナリカーネルをライブラリからロードする機能を導入し、特に Adreno GPU を対象としています。このアップデートでは、CPU、GPU、および各種アクセラレータバックエンドに対して、macOS、Linux、Windows、Android、openEuler のバイナリも提供されます。

  • 循環依存関係を解決するために ggml-backend-dl を介してバイナリカーネルライブラリのロードを可能にします。
  • カーネルライブラリから gemm_moe_mxfp4_f32_ns、q8_0、q4_0、q4_1、および q4_k moe gemm などの特定のカーネルをロードします。
  • OpenCL Adreno サポートに対して get_adreno_bin_kernel_func_t を常に宣言します。
  • このリリースでは、KleidiAI を備えた macOS Apple Silicon は無効化されています。

この強化により、プリコンパイル済みバイナリカーネルを有効にすることで OpenCL パフォーマンスが向上し、幅広いハードウェアプラットフォームとの互換性が維持されます。