Le projet llama.cpp a publié la version b9838, fournissant des binaires préconstruits pour un large éventail de systèmes d'exploitation et d'accélérateurs matériels. Cette version inclut le support du CPU, du GPU (CUDA, Vulkan, ROCm, OpenCL) et des accélérateurs IA spécialisés sur macOS, Linux, Windows, Android et openEuler.

  • Les builds pour macOS sont disponibles pour Apple Silicon (arm64) et Intel (x64), avec le support KleidiAI désactivé.
  • Les binaires Linux sont fournis pour les architectures Ubuntu x64, arm64 et s390x, incluant les variantes CPU, Vulkan, ROCm 7.2, OpenVINO et SYCL.
  • Les versions Windows incluent des builds CPU, CUDA 12/13, Vulkan, OpenCL Adreno, OpenVINO, SYCL et HIP pour x64 et arm64.
  • Le support Android est limité aux builds CPU arm64.
  • Les builds openEuler sont disponibles pour les architectures x86 et aarch64 en utilisant ACL Graph, avec le support standard openEuler désactivé.

La release permet aux utilisateurs de déployer llama.cpp sur des configurations matérielles diverses sans compiler depuis les sources.