Le projet llama.cpp a publié la version b9835, qui inclut une correction pour les fonctionnalités d'arrêt et de saut de raisonnement en mode mono-modèle. Cette mise à jour résout des problèmes spécifiques au sein de l'interface utilisateur afin d'améliorer le contrôle pendant l'inférence du modèle.
- macOS : Binaires fournis pour Apple Silicon (arm64) et Intel (x64), avec KleidiAI désactivé sur Apple Silicon ; iOS XCFramework inclus.
- Linux : Builds disponibles pour Ubuntu x64 et arm64 (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16).
- Android : Binaire CPU fourni pour l'architecture arm64.
- Windows : Binaires pour les CPUs x64 et arm64, plus prise en charge du GPU via CUDA 12/13, Vulkan, OpenCL Adreno, OpenVINO, SYCL et HIP.
- openEuler : Builds pour x86 (310p, 910b ACL Graph) et aarch64 (310p, 910b ACL Graph), avec le support standard désactivé.
La release assure une compatibilité matérielle élargie sur plusieurs systèmes d'exploitation et accélérateurs tout en corrigeant le comportement de l'interface utilisateur dans les scénarios mono-modèle.