Proyek llama.cpp merilis build b9871, yang mencakup perbaikan untuk implementasi penggabungan CPU yang rusak saat menangani tipe data terkuantisasi.

  • Perubahan inti mengatasi bug dalam logika penggabungan CPU ggml untuk tipe terkuantisasi, disertai dengan tes baru untuk memverifikasi kebenaran.
  • Binari pra-dibangun tersedia untuk macOS (Apple Silicon dan Intel), Linux (Ubuntu x64/arm64/s390x with CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL), Windows (CPU, CUDA 12/13, Vulkan, OpenCL, OpenVINO, SYCL, HIP), Android arm64, dan openEuler.
  • Binari UI yang diperbarui juga disertakan dalam rilis ini.