github llama.cpp · há 11 d · inference

Lançamento do llama.cpp b9742: Atualizado com stride preenchido para pesos SSM-conv

Traduzido do English → Português (BR)

A versão b9742 do llama.cpp introduz stride preenchido para pesos SSM-conv, melhorando a eficiência nas operações de redes neurais. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e APIs, incluindo Vulkan, CUDA, OpenVINO e SYCL.

Importância 0/3 Confiança 2/3 llama.cpp

Ler original