La version b9810 de llama.cpp ajoute le mappage cublasSgemmBatched et de nouveaux binaires

Le projet llama.cpp a publié la version b9810, introduisant un mappage CUDA pour `cublasSgemmBatched` dans les en-têtes fournisseurs HIP/MUSA. Cette mise à jour est accompagnée d'un ensemble complet de binaires préconstruits pour les plateformes macOS, Linux, Windows, Android et openEuler.

Ajout du mappage cublasSgemmBatched pour les en-têtes fournisseurs HIP/MUSA via la demande de tirage #25033.
Désactivation du support KleidiAI pour les builds macOS Apple Silicon.
Fourniture de binaires pour Ubuntu x64/arm64/s390x (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16).
Inclusion des builds Windows pour CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL et HIP.
Publication de l'XCFramework iOS, des binaires Android arm64 (CPU) et macOS Apple Silicon/Intel.

La version assure une large compatibilité matérielle en proposant des builds spécifiques pour divers accélérateurs comme ROCm, SYCL et OpenVINO, ainsi que les versions CPU standard.