github llama.cpp · há 12 d · inference

Llama.cpp Release b9716 Adiciona Suporte a Lote para InternVL

Traduzido do English → Português (BR)

A versão b9716 do llama.cpp introduz suporte a processamento em lote para o InternVL, melhorando o desempenho do modelo por meio de processamento eficiente em lotes. O lançamento inclui builds binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware, incluindo Vulkan, OpenVINO, SYCL e ROCm.

Importância 0/3 Confiança 2/3 llama.cpp

Ler original