Lançamento b9844 do llama.cpp adiciona suporte a NVFP4 e novos binários
O projeto llama.cpp lançou a versão b9844, que introduz o suporte ao ggml-webgpu para o formato de quantização NVFP4. Esta atualização também fornece binários pré-compilados para macOS, iOS, Linux, Android, Windows e openEuler em vários backends de hardware.