github llama.cpp · il y a 12 j · inference

llama.cpp Release b9716 Adds Batching Support for InternVL

Traduit de English → Français

La version b9716 de llama.cpp introduit la prise en charge du traitement par lots pour InternVL, améliorant les performances du modèle grâce à un traitement efficace par lots. La release inclut des builds binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, y compris Vulkan, OpenVINO, SYCL et ROCm.

Importance 0/3 Confiance 2/3 llama.cpp

Lire l'original