Le projet llama.cpp a publié la version b9867, introduisant le support de la spécification spec-draft-p-min au sein de DFlash. Cette mise à jour inclut des modifications de code pour ajouter un garde n_min et s'assurer que n_min et n_max sont correctement protégés.
- Support de spec-draft-p-min dans DFlash via la pull request #25246.
- Ajout d'un garde n_min dans le module dflash.
- Protection des paramètres n_min et n_max.
- Binaires macOS Apple Silicon (arm64) fournis, tandis que le support KleidiAI est désactivé.
- Builds Linux disponibles pour Ubuntu x64/arm64/s390x avec les backends CPU, Vulkan, ROCm 7.2, OpenVINO et SYCL.
- Binaires Android arm64 (CPU) publiés.
- Les builds Windows x64/arm64 prennent en charge CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL et HIP.
- Builds openEuler x86 et aarch64 pour 310p et 910b (ACL Graph) sont disponibles.
Cette release fournit des binaires mis à jour sur plusieurs plateformes et accélérateurs matériels, permettant aux utilisateurs d'exécuter llama.cpp avec le nouveau support de la spécification DFlash.