llama.cpp b9829 Release : journaux réduits et binaires multi-plateformes

Le projet llama.cpp a publié la version b9829, qui inclut une réduction de la sortie des journaux dans le serveur, les composants communs et les modules de décodage spéculatif. Cette mise à jour standardise également les conventions de nommage en remplaçant CMN_ par COM_.

Les journaux du serveur ont été réduits pour un meilleur contrôle de la verbosité.
Les builds macOS Apple Silicon sont disponibles, mais le support KleidiAI est désactivé.
Les binaires Linux couvrent Ubuntu x64, arm64, s390x, Vulkan, ROCm 7.2, OpenVINO et SYCL FP32/FP16.
Les versions Windows incluent les variantes CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL et HIP.
Des binaires Android arm64 (CPU) et iOS XCFramework sont fournis.
Le support openEuler est désactivé pour x86 mais disponible pour aarch64 avec ACL Graph.

Cette version fournit des binaires mis à jour pour les développeurs sur divers systèmes d'exploitation et accélérateurs matériels, garantissant la compatibilité avec les versions récentes de CUDA et réduisant le bruit des journaux dans les environnements serveur.