Rilis b9859 llama.cpp memperkenalkan kemampuan untuk memuat kernel biner precompiled dari pustaka untuk OpenCL, khususnya menargetkan GPU Adreno. Pembaruan ini juga menyediakan biner untuk macOS, Linux, Windows, Android, dan openEuler di seluruh CPU, GPU, dan berbagai backend akselerator.

  • Memungkinkan pemuatan pustaka kernel biner melalui ggml-backend-dl untuk menyelesaikan dependensi siklik.
  • Memuat kernel tertentu seperti gemm_moe_mxfp4_f32_ns, q8_0, q4_0, q4_1, dan q4_k moe gemm dari pustaka kernel.
  • Selalu mendeklarasikan get_adreno_bin_kernel_func_t untuk dukungan Adreno OpenCL.
  • macOS Apple Silicon dengan KleidiAI dinonaktifkan dalam rilis ini.

Peningkatan ini meningkatkan performa OpenCL dengan mengaktifkan kernel biner precompiled sambil mempertahankan kompatibilitas di berbagai platform perangkat keras.