A versão b9761 do llama.cpp transfere o download de modelos para um processo filho dedicado e adiciona rastreamento de progresso em tempo real via /models/sse. O lançamento inclui binários para macOS, Linux, Android, Windows e openEuler, suportando várias arquiteturas e aceleradores de hardware como CUDA, Vulkan, OpenVINO e SYCL.