El proyecto llama.cpp ha lanzado la versión b9858, que incluye un cambio para usar el split principal de Hugging Face como ruta del modelo. Esta actualización resuelve el problema #25181 respecto a las rutas de carga de modelos.

  • Están disponibles binarios para macOS Apple Silicon (arm64) e Intel (x64).
  • Se incluye un XCFramework para iOS para despliegue móvil.
  • Las compilaciones de Linux admiten Ubuntu x64, arm64, s390x, Vulkan, ROCm 7.2, OpenVINO y SYCL FP32/FP16.
  • Se proporcionan binarios para Android arm64 (CPU).
  • Las compilaciones de Windows cubren CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL e HIP.
  • Se enumeran compilaciones de openEuler para x86 y aarch64 con soporte ACL Graph, aunque algunas configuraciones están deshabilitadas.

Este lanzamiento proporciona binarios actualizados para una amplia gama de arquitecturas de hardware y sistemas operativos, garantizando la compatibilidad con los últimos estándares de carga de modelos.