Rilis llama.cpp b9852 menambahkan dukungan q1_0 OpenCL

Proyek llama.cpp telah merilis versi b9852, memperkenalkan dukungan awal OpenCL untuk format kuantisasi q1_0. Pembaruan ini mencakup kemampuan q1_0 umum dan implementasi GEMM/GEMV Adreno spesifik untuk perangkat OpenCL.

Dukungan OpenCL awal untuk kuantisasi q1_0
Ditambahkan kernel GEMM/GEMV Adreno untuk q1_0
Binari macOS Apple Silicon (arm64) disediakan
KleidiAI pada macOS Apple Silicon dinonaktifkan dalam rilis ini
Build Ubuntu tersedia untuk CPU, Vulkan, ROCm 7.2, OpenVINO, dan SYCL
Build Windows mencakup CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP, dan Adreno OpenCL
Binari Android arm64 (CPU) dirilis
Dukungan openEuler untuk arsitektur x86 dan aarch64 dengan ACL Graph diaktifkan

Rilis ini memperluas kompatibilitas perangkat keras dengan mengaktifkan inferensi q1_0 yang efisien pada perangkat OpenCL dan menyediakan binari yang diperbarui di berbagai sistem operasi dan akselerator.