github llama.cpp · há 12 d · inference

LLaMA.cpp Lança b9722: Correções e Binários Multiplataforma

Traduzido do English → Português (BR)

A versão b9722 do LLaMA.cpp corrige um problema de valor n_discard não vinculado no tratamento do contexto do servidor. O lançamento inclui binários pré-compilados para macOS, Linux, Android, Windows e openEuler, suportando várias arquiteturas e frameworks de aceleração como Vulkan, CUDA, OpenVINO e SYCL.

Importância 0/3 Confiança 2/3 llama.cpp

Ler original