github llama.cpp · há 16 d · inference

Relese do llama.cpp b9699 adiciona suporte a SYCL e binários para múltiplas plataformas

Traduzido do English → Português (BR)

A versão b9699 do llama.cpp introduz suporte às operações MUL_MAT e OUT_PROD com precisão Q1_0 por meio do PR #24721. A release inclui binários pré-compilados para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e frameworks de aceleração, incluindo SYCL (FP32 e FP16), Vulkan, CUDA, ROCm e OpenVINO.

Importância 0/3 Confiança 1/3 llama.cpp

Ler original