llama.cpp version b9752 : refonte du serveur et binaires multiplateformes
llama.cpp publie la version b9752 avec une refonte du serveur axée sur la construction par lots, incluant une meilleure gestion des cas de lot complet et des corrections de bugs. La publication inclut des binaires précompilés pour macOS, Linux, Android, Windows et openEuler, prenant en charge diverses architectures et frameworks d'accélération tels que CUDA, Vulkan, OpenVINO et SYCL.