github llama.cpp · há 14 d · inference

llama.cpp lança versão b9688 com novas APIs e binários multiplataforma

Traduzido do English → Português (BR)

O llama.cpp lança a versão b9688, adicionando APIs de gerenciamento de modelos e atualizações em tempo real via SSE. O lançamento inclui binários pré-compilados para macOS, Linux, Android, Windows e openEuler, suportando várias arquiteturas e frameworks de aceleração como Vulkan, CUDA, OpenVINO e SYCL.

Importância 1/3 Confiança 2/3 llama.cpp API & product launches Code generation Inference efficiency

Ler original