Le projet llama.cpp a publié la version b9829, qui inclut une réduction de la sortie des journaux dans le serveur, les composants communs et les modules de décodage spéculatif. Cette mise à jour standardise également les conventions de nommage en remplaçant CMN_ par COM_.

  • Les journaux du serveur ont été réduits pour un meilleur contrôle de la verbosité.
  • Les builds macOS Apple Silicon sont disponibles, mais le support KleidiAI est désactivé.
  • Les binaires Linux couvrent Ubuntu x64, arm64, s390x, Vulkan, ROCm 7.2, OpenVINO et SYCL FP32/FP16.
  • Les versions Windows incluent les variantes CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL et HIP.
  • Des binaires Android arm64 (CPU) et iOS XCFramework sont fournis.
  • Le support openEuler est désactivé pour x86 mais disponible pour aarch64 avec ACL Graph.

Cette version fournit des binaires mis à jour pour les développeurs sur divers systèmes d'exploitation et accélérateurs matériels, garantissant la compatibilité avec les versions récentes de CUDA et réduisant le bruit des journaux dans les environnements serveur.