Le projet llama.cpp a publié la version b9867, introduisant le support de la spécification spec-draft-p-min au sein de DFlash. Cette mise à jour inclut des modifications de code pour ajouter un garde n_min et s'assurer que n_min et n_max sont correctement protégés.

  • Support de spec-draft-p-min dans DFlash via la pull request #25246.
  • Ajout d'un garde n_min dans le module dflash.
  • Protection des paramètres n_min et n_max.
  • Binaires macOS Apple Silicon (arm64) fournis, tandis que le support KleidiAI est désactivé.
  • Builds Linux disponibles pour Ubuntu x64/arm64/s390x avec les backends CPU, Vulkan, ROCm 7.2, OpenVINO et SYCL.
  • Binaires Android arm64 (CPU) publiés.
  • Les builds Windows x64/arm64 prennent en charge CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL et HIP.
  • Builds openEuler x86 et aarch64 pour 310p et 910b (ACL Graph) sont disponibles.

Cette release fournit des binaires mis à jour sur plusieurs plateformes et accélérateurs matériels, permettant aux utilisateurs d'exécuter llama.cpp avec le nouveau support de la spécification DFlash.