github llama.cpp · il y a 14 j · inference

llama.cpp release b9675 ajoute le support FP16 et de nouveaux binaires pour plateformes

Traduit de English → Français

La version b9675 de llama.cpp active le support FP16 pour des opérations telles que SQR, SQRT, LOG, SIN, COS et CLAMP. La publication inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures, avec le support de Vulkan, ROCm, OpenVINO, SYCL (FP16 et FP32), ainsi que CUDA 12.4 et 13.3.

Importance 1/3 Confiance 2/3 llama.cpp Code generation Hardware & chips Inference efficiency

Lire l'original