Proyek llama.cpp telah merilis versi b9829, yang mencakup pengurangan output logging di server, komponen umum, dan modul decoding spekulatif. Pembaruan ini juga menstandarisasi konvensi penamaan dengan mengganti CMN_ menjadi COM_.
- Log server telah dikurangi untuk kontrol verbosity yang lebih baik.
- Build macOS Apple Silicon tersedia, tetapi dukungan KleidiAI dinonaktifkan.
- Binari Linux mencakup Ubuntu x64, arm64, s390x, Vulkan, ROCm 7.2, OpenVINO, dan SYCL FP32/FP16.
- Rilis Windows mencakup varian CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL, dan HIP.
- Binari Android arm64 (CPU) dan iOS XCFramework disediakan.
- Dukungan openEuler dinonaktifkan untuk x86 tetapi tersedia untuk aarch64 dengan ACL Graph.
Rilis ini menyediakan binari yang diperbarui untuk pengembang di berbagai sistem operasi dan akselerator perangkat keras, memastikan kompatibilitas dengan versi CUDA terbaru dan mengurangi kebisingan log di lingkungan server.