github llama.cpp · há 10 d · inference

Lançamento do llama.cpp b9757: Novos Binários e Recursos

Traduzido do English → Português (BR)

O llama.cpp lança a versão b9757 com binários atualizados para macOS, Linux, Android, Windows e openEuler. A versão remove o softmax+sort incondicional no amostrador top-n-sigma, melhorando a eficiência da amostragem. As novas compilações suportam Vulkan, OpenVINO, SYCL, ROCm e CUDA em múltiplas arquiteturas, incluindo Apple Silicon e ARM64.

Importância 0/3 Confiança 2/3 llama.cpp

Ler original