La version b9831 de llama.cpp ajoute le support DFlash et de nouveaux binaires

La version b9831 de llama.cpp introduit le support de DFlash v2, incluant l'attention à fenêtre glissante par type de couche, ainsi qu'un ensemble complet de binaires préconstruits pour plusieurs plateformes.

Les versions macOS Apple Silicon (arm64) et Intel (x64) sont disponibles, ainsi qu'un XCFramework iOS.
Les binaires Linux couvrent Ubuntu x64 et arm64 CPU, le CPU s390x, Vulkan, ROCm 7.2, OpenVINO et SYCL FP32/FP16.
Des versions Android pour CPU arm64 sont fournies pour les appareils mobiles.
Les versions Windows incluent des variantes CPU, OpenCL Adreno, CUDA 12.4 et 13.3, Vulkan, OpenVINO, SYCL et HIP.
Les versions openEuler x86 et aarch64 avec support ACL Graph sont incluses, tandis que les versions macOS KleidiAI et openEuler génériques sont désactivées.

Cette version permet aux utilisateurs d'exécuter llama.cpp sur une plus large gamme d'accélérateurs matériels et de systèmes d'exploitation grâce aux nouvelles fonctionnalités d'optimisation DFlash.