github llama.cpp · il y a 14 j · inference

llama.cpp release b9682 ajoute le support Vulkan et de nouveaux binaires pour plateformes

Traduit de English → Français

La version b9682 de llama.cpp introduit le support Vulkan pour Linux et Windows, permettant l'accélération GPU. La publication inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures, avec des options CPU et GPU incluant CUDA, OpenVINO, SYCL et ROCm.

Importance 1/3 Confiance 2/3 llama.cpp Code generation Hardware & chips Inference efficiency

Lire l'original