Rilis llama.cpp b9842 memperkenalkan perubahan untuk mendeduplikasi entri preset dan model ter-cache pada endpoint /v1/models. Pembaruan ini disetujui oleh Adrien Gallouët dari Hugging Face.

  • Binaries macOS Apple Silicon (arm64) tersedia, sementara dukungan KleidiAI tetap dinonaktifkan.
  • Build Linux mencakup versi CPU Ubuntu x64/arm64/s390x, Vulkan, ROCm 7.2, OpenVINO, dan varian SYCL FP32/FP16.
  • Binaries Android arm64 (CPU) disediakan untuk penyebaran di perangkat seluler.
  • Rilis Windows mencakup CPU x64/arm64, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL, dan backend HIP.
  • Dukungan openEuler mencakup build x86 dan aarch64 dengan ACL Graph untuk chip 310p dan 910b, meskipun openEuler standar dinonaktifkan.
  • Binary UI mandiri juga disertakan dalam aset rilis.

Rilis ini menyediakan binary yang diperbarui di berbagai platform dan akselerator perangkat keras, memastikan kompatibilitas dengan berbagai arsitektur CPU dan GPU.