Le projet llama.cpp a publié la version b9829, qui inclut une réduction de la sortie des journaux dans le serveur, les composants communs et les modules de décodage spéculatif. Cette mise à jour standardise également les conventions de nommage en remplaçant CMN_ par COM_.
- Les journaux du serveur ont été réduits pour un meilleur contrôle de la verbosité.
- Les builds macOS Apple Silicon sont disponibles, mais le support KleidiAI est désactivé.
- Les binaires Linux couvrent Ubuntu x64, arm64, s390x, Vulkan, ROCm 7.2, OpenVINO et SYCL FP32/FP16.
- Les versions Windows incluent les variantes CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL et HIP.
- Des binaires Android arm64 (CPU) et iOS XCFramework sont fournis.
- Le support openEuler est désactivé pour x86 mais disponible pour aarch64 avec ACL Graph.
Cette version fournit des binaires mis à jour pour les développeurs sur divers systèmes d'exploitation et accélérateurs matériels, garantissant la compatibilité avec les versions récentes de CUDA et réduisant le bruit des journaux dans les environnements serveur.