El proyecto llama.cpp ha lanzado la versión b9858, que incluye un cambio para usar el split principal de Hugging Face como ruta del modelo. Esta actualización resuelve el problema #25181 respecto a las rutas de carga de modelos.
- Están disponibles binarios para macOS Apple Silicon (arm64) e Intel (x64).
- Se incluye un XCFramework para iOS para despliegue móvil.
- Las compilaciones de Linux admiten Ubuntu x64, arm64, s390x, Vulkan, ROCm 7.2, OpenVINO y SYCL FP32/FP16.
- Se proporcionan binarios para Android arm64 (CPU).
- Las compilaciones de Windows cubren CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL e HIP.
- Se enumeran compilaciones de openEuler para x86 y aarch64 con soporte ACL Graph, aunque algunas configuraciones están deshabilitadas.
Este lanzamiento proporciona binarios actualizados para una amplia gama de arquitecturas de hardware y sistemas operativos, garantizando la compatibilidad con los últimos estándares de carga de modelos.