github llama.cpp · 16 д назад · inference

llama.cpp выпускает b9704: исправлена обработка некорректной грамматики и добавлены новые бинарные файлы

Переведено с English → Русский

Версия llama.cpp b9704 теперь возвращает HTTP 400 для некорректной грамматики вместо тихого отбрасывания ограничений. В релиз включены бинарные файлы для macOS, Linux, Android, Windows и openEuler для нескольких архитектур и аппаратных ускорителей, с поддержкой Vulkan, ROCm, OpenVINO, SYCL и CUDA.

Важность 1/3 Доверие 1/3 llama.cpp Inference efficiency Open weights

Оригинал