github llama.cpp · 16 д назад · inference

В llama.cpp версии b9699 добавлена поддержка SYCL и бинарные файлы для нескольких платформ

Переведено с English → Русский

llama.cpp версия b9699 вводит поддержку операций MUL_MAT и OUT_PROD с точностью Q1_0 через PR #24721. В релиз включены предварительно скомпилированные бинарные файлы для macOS, Linux, Android, Windows и openEuler для нескольких архитектур и фреймворков ускорения, включая SYCL (FP32 и FP16), Vulkan, CUDA, ROCm и OpenVINO.

Важность 0/3 Доверие 1/3 llama.cpp

Оригинал