llama.cpp 版本 b9747 通过 SSE 端点引入了实时模型加载进度跟踪。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持各种架构以及 Vulkan、CUDA、OpenVINO 和 SYCL 等加速技术。