La release b9867 de llama.cpp ajoute le support de spec-draft-p-min dans DFlash

Le projet llama.cpp a publié la version b9867, introduisant le support de la spécification spec-draft-p-min au sein de DFlash. Cette mise à jour inclut des modifications de code pour ajouter un garde n_min et s'assurer que n_min et n_max sont correctement protégés.

Support de spec-draft-p-min dans DFlash via la pull request #25246.
Ajout d'un garde n_min dans le module dflash.
Protection des paramètres n_min et n_max.
Binaires macOS Apple Silicon (arm64) fournis, tandis que le support KleidiAI est désactivé.
Builds Linux disponibles pour Ubuntu x64/arm64/s390x avec les backends CPU, Vulkan, ROCm 7.2, OpenVINO et SYCL.
Binaires Android arm64 (CPU) publiés.
Les builds Windows x64/arm64 prennent en charge CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL et HIP.
Builds openEuler x86 et aarch64 pour 310p et 910b (ACL Graph) sont disponibles.

Cette release fournit des binaires mis à jour sur plusieurs plateformes et accélérateurs matériels, permettant aux utilisateurs d'exécuter llama.cpp avec le nouveau support de la spécification DFlash.