La version b9761 de llama.cpp déplace le téléchargement des modèles vers un processus enfant dédié et ajoute un suivi des progrès en temps réel via /models/sse. La release inclut des binaires pour macOS, Linux, Android, Windows et openEuler, prenant en charge diverses architectures et accélérateurs matériels tels que CUDA, Vulkan, OpenVINO et SYCL.