llama.cpp выпускает версию b9757 с обновленными бинарниками для macOS, Linux, Android, Windows и openEuler. В релизе удаляется неусловная softmax+sort в сэмплере top-n-sigma, что улучшает эффективность сэмплирования. Новые сборки поддерживают Vulkan, OpenVINO, SYCL, ROCm и CUDA на нескольких архитектурах, включая Apple Silicon и ARM64.