Версия llama.cpp b9704 теперь возвращает HTTP 400 для некорректной грамматики вместо тихого отбрасывания ограничений. В релиз включены бинарные файлы для macOS, Linux, Android, Windows и openEuler для нескольких архитектур и аппаратных ускорителей, с поддержкой Vulkan, ROCm, OpenVINO, SYCL и CUDA.