Lançamento do llama.cpp b9757: Novos Binários e Recursos
O llama.cpp lança a versão b9757 com binários atualizados para macOS, Linux, Android, Windows e openEuler. A versão remove o softmax+sort incondicional no amostrador top-n-sigma, melhorando a eficiência da amostragem. As novas compilações suportam Vulkan, OpenVINO, SYCL, ROCm e CUDA em múltiplas arquiteturas, incluindo Apple Silicon e ARM64.