llama.cpp Release b9757 : nouveaux binaires et fonctionnalités
llama.cpp publie la version b9757 avec des binaires mis à jour pour macOS, Linux, Android, Windows et openEuler. La release supprime le softmax+sort inconditionnel dans le top-n-sigma sampler, améliorant l'efficacité de l'échantillonnage. Les nouvelles builds prennent en charge Vulkan, OpenVINO, SYCL, ROCm et CUDA sur plusieurs architectures, y compris Apple Silicon et ARM64.