github llama.cpp · il y a 14 j · inference

llama.cpp publie la version b9688 avec de nouvelles API et des binaires multiplateformes

Traduit de English → Français

llama.cpp publie la version b9688, ajoutant des API de gestion des modèles et de mises à jour en temps réel SSE. La release inclut des binaires précompilés pour macOS, Linux, Android, Windows et openEuler, prenant en charge diverses architectures et frameworks d'accélération comme Vulkan, CUDA, OpenVINO et SYCL.

Importance 1/3 Confiance 2/3 llama.cpp API & product launches Code generation Inference efficiency

Lire l'original