llama.cpp b9859 릴리스에 OpenCL 사전 컴파일된 커널 지원 추가

llama.cpp b9859 릴리스는 OpenCL을 위해 라이브러리에서 사전 컴파일된 바이너리 커널을 로드할 수 있는 기능을 도입했으며, 특히 Adreno GPU를 대상으로 합니다. 이 업데이트는 CPU, GPU 및 다양한 가속기 백엔드에 대해 macOS, Linux, Windows, Android, openEuler에 대한 바이너리도 제공합니다.

ggml-backend-dl을 통해 바이너리 커널 라이브러리를 로드하여 순환 종속성을 해결합니다.
커널 라이브러리에서 gemm_moe_mxfp4_f32_ns, q8_0, q4_0, q4_1 및 q4_k moe gemm과 같은 특정 커널을 로드합니다.
OpenCL Adreno 지원을 위해 get_adreno_bin_kernel_func_t를 항상 선언합니다.
이 릴리스에서는 KleidiAI가 있는 macOS Apple Silicon이 비활성화되었습니다.

이 향상된 기능은 사전 컴파일된 바이너리 커널을 활성화하여 OpenCL 성능을 개선하고 광범위한 하드웨어 플랫폼 간의 호환성을 유지합니다.