Lanzamiento de llama.cpp b9816: Sincronización con ggml y nuevos binarios

El proyecto llama.cpp ha lanzado la versión b9816, que incluye una sincronización con la biblioteca ggml. Esta actualización proporciona binarios precompilados para las plataformas macOS, iOS, Linux, Windows, Android y openEuler.

Las compilaciones de macOS para Apple Silicon (arm64) e Intel (x64) están disponibles, mientras que el soporte de KleidiAI está deshabilitado.
Los binarios de Linux cubren CPU x64 y arm64 de Ubuntu, Vulkan, ROCm 7.2, OpenVINO y variantes SYCL FP32/FP16.
Las versiones para Windows incluyen opciones de CPU, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL, HIP y OpenCL Adreno.
Se proporcionan binarios Android arm64 (CPU) e iOS XCFramework para implementación móvil.
El soporte de openEuler incluye compilaciones x86 y aarch64 con ACL Graph, aunque el openEuler estándar está deshabilitado.

Este lanzamiento permite a los usuarios ejecutar llama.cpp en una amplia variedad de arquitecturas de hardware y sistemas operativos utilizando la última versión del backend ggml.