llama.cpp b9871 memperbaiki penggabungan CPU yang rusak untuk tipe terkuantisasi

Proyek llama.cpp merilis build b9871, yang mencakup perbaikan untuk implementasi penggabungan CPU yang rusak saat menangani tipe data terkuantisasi.

Perubahan inti mengatasi bug dalam logika penggabungan CPU ggml untuk tipe terkuantisasi, disertai dengan tes baru untuk memverifikasi kebenaran.
Binari pra-dibangun tersedia untuk macOS (Apple Silicon dan Intel), Linux (Ubuntu x64/arm64/s390x with CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL), Windows (CPU, CUDA 12/13, Vulkan, OpenCL, OpenVINO, SYCL, HIP), Android arm64, dan openEuler.
Binari UI yang diperbarui juga disertakan dalam rilis ini.