llama.cpp b9816 Release : synchronisation avec ggml et nouveaux binaires

Le projet llama.cpp a publié la version b9816, qui inclut une synchronisation avec la bibliothèque ggml. Cette mise à jour fournit des binaires préconstruits pour les plateformes macOS, iOS, Linux, Windows, Android et openEuler.

Les versions macOS Apple Silicon (arm64) et Intel (x64) sont disponibles, tandis que le support KleidiAI est désactivé.
Les binaires Linux couvrent Ubuntu x64 et arm64 CPU, Vulkan, ROCm 7.2, OpenVINO et les variantes SYCL FP32/FP16.
Les versions Windows incluent des options CPU, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL, HIP et OpenCL Adreno.
Des binaires Android arm64 (CPU) et iOS XCFramework sont fournis pour le déploiement mobile.
Le support openEuler inclut les versions x86 et aarch64 avec ACL Graph, bien qu'openEuler standard soit désactivé.

Cette version permet aux utilisateurs d'exécuter llama.cpp sur une grande variété d'architectures matérielles et de systèmes d'exploitation en utilisant le dernier backend ggml.