github llama.cpp · há 14 d · inference

llama.cpp lança b9680: novos binários e suporte a Vulkan

Traduzido do English → Português (BR)

O llama.cpp lançou a versão b9680 com suporte atualizado ao Vulkan e novos binários para macOS, Linux, Android, Windows e openEuler. O lançamento inclui variantes de CPU e GPU para múltiplas arquiteturas, com suporte para Vulkan, CUDA, OpenVINO, SYCL e ROCm.

Importância 1/3 Confiança 2/3 llama.cpp Code generation Hardware & chips Inference efficiency

Ler original