github llama.cpp · 7 д назад · inference

llama.cpp release b9682 добавляет поддержку Vulkan и новые бинарники для платформ

Переведено с English → Русский

Версия llama.cpp b9682 добавляет поддержку Vulkan для Linux и Windows, что позволяет использовать ускорение GPU. В этом выпуске представлены бинарники для macOS, Linux, Android, Windows и openEuler на разных архитектурах, с вариантами CPU и GPU, включая CUDA, OpenVINO, SYCL и ROCm.

Важность 1/3 Доверие 2/3 llama.cpp Code generation Hardware & chips Inference efficiency

Оригинал