la versión b9844 de llama.cpp añade soporte NVFP4 y nuevos binarios
El proyecto llama.cpp ha lanzado la versión b9844, que introduce soporte ggml-webgpu para el formato de cuantización NVFP4. Esta actualización también proporciona binarios precompilados para macOS, iOS, Linux, Android, Windows y openEuler en varios backends de hardware.