llama.cpp publie la version b9688, ajoutant des API de gestion des modèles et de mises à jour en temps réel SSE. La release inclut des binaires précompilés pour macOS, Linux, Android, Windows et openEuler, prenant en charge diverses architectures et frameworks d'accélération comme Vulkan, CUDA, OpenVINO et SYCL.