llama.cpp publica la versión b9757 con binarios actualizados para macOS, Linux, Android, Windows y openEuler. La versión elimina el softmax+sort incondicional en el sampler top-n-sigma, mejorando la eficiencia del muestreo. Las nuevas compilaciones admiten Vulkan, OpenVINO, SYCL, ROCm y CUDA en múltiples arquitecturas, incluyendo Apple Silicon y ARM64.
llama.cpp lanza b9757: nuevos binarios y características
Traducido del English → Español