llama.cpp publie la version b9752 avec une refonte du serveur axée sur la construction par lots, incluant une meilleure gestion des cas de lot complet et des corrections de bugs. La publication inclut des binaires précompilés pour macOS, Linux, Android, Windows et openEuler, prenant en charge diverses architectures et frameworks d'accélération tels que CUDA, Vulkan, OpenVINO et SYCL.