O llama.cpp lança a versão b9757 com binários atualizados para macOS, Linux, Android, Windows e openEuler. A versão remove o softmax+sort incondicional no amostrador top-n-sigma, melhorando a eficiência da amostragem. As novas compilações suportam Vulkan, OpenVINO, SYCL, ROCm e CUDA em múltiplas arquiteturas, incluindo Apple Silicon e ARM64.