github llama.cpp · il y a 10 j · inference

llama.cpp version b9747 ajoute le suivi en temps réel du chargement des modèles et de nouveaux binaires pour plateformes

Traduit de English → Français

La version llama.cpp b9747 introduit le suivi en temps réel de la progression du chargement des modèles via des points de terminaison SSE. La publication inclut des binaires pour macOS, Linux, Android, Windows et openEuler, prenant en charge diverses architectures et technologies d'accélération telles que Vulkan, CUDA, OpenVINO et SYCL.

Importance 0/3 Confiance 2/3 llama.cpp

Lire l'original