El proyecto llama.cpp ha lanzado la versión b9816, que incluye una sincronización con la biblioteca ggml. Esta actualización proporciona binarios precompilados para las plataformas macOS, iOS, Linux, Windows, Android y openEuler.

  • Las compilaciones de macOS para Apple Silicon (arm64) e Intel (x64) están disponibles, mientras que el soporte de KleidiAI está deshabilitado.
  • Los binarios de Linux cubren CPU x64 y arm64 de Ubuntu, Vulkan, ROCm 7.2, OpenVINO y variantes SYCL FP32/FP16.
  • Las versiones para Windows incluyen opciones de CPU, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL, HIP y OpenCL Adreno.
  • Se proporcionan binarios Android arm64 (CPU) e iOS XCFramework para implementación móvil.
  • El soporte de openEuler incluye compilaciones x86 y aarch64 con ACL Graph, aunque el openEuler estándar está deshabilitado.

Este lanzamiento permite a los usuarios ejecutar llama.cpp en una amplia variedad de arquitecturas de hardware y sistemas operativos utilizando la última versión del backend ggml.