la versión b9761 de llama.cpp traslada la descarga de modelos a un proceso hijo dedicado y añade seguimiento del progreso en tiempo real mediante /models/sse. La liberación incluye binarios para macOS, Linux, Android, Windows y openEuler, con soporte para varias arquitecturas y aceleradores de hardware como CUDA, Vulkan, OpenVINO y SYCL.