llama.cpp 版本 b9753 引入了改进的规范模型加载进度报告,包括新的“阶段”列表。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构和硬件加速选项,如 Vulkan、CUDA、OpenVINO 和 SYCL。