github llama.cpp · há 13 d · inference

llama.cpp release b9704: corrige manipulação de gramática inválida e adiciona novos binários

Traduzido do English → Português (BR)

A versão b9704 do llama.cpp agora retorna HTTP 400 para gramática inválida em vez de descartar silenciosamente as restrições. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler em várias arquiteturas e aceleradores de hardware, com suporte para Vulkan, ROCm, OpenVINO, SYCL e CUDA.

Importância 1/3 Confiança 2/3 llama.cpp Inference efficiency Open weights

Ler original