llama.cpp выпускает версию b9751 с обновлёнными бинарниками для macOS, Linux, Android, Windows и openEuler. В релизе включены исправления по использованию памяти и поддержка нескольких архитектур и вариантов ускорения на аппаратном уровне, таких как Vulkan, CUDA, OpenVINO и SYCL.