github llama.cpp · il y a 9 j · inference

llama.cpp version b9752 : refonte du serveur et binaires multiplateformes

Traduit de English → Français

llama.cpp publie la version b9752 avec une refonte du serveur axée sur la construction par lots, incluant une meilleure gestion des cas de lot complet et des corrections de bugs. La publication inclut des binaires précompilés pour macOS, Linux, Android, Windows et openEuler, prenant en charge diverses architectures et frameworks d'accélération tels que CUDA, Vulkan, OpenVINO et SYCL.

Importance 0/3 Confiance 2/3 llama.cpp

Lire l'original