llama.cpp 发布版本 b9688,新增模型管理和 SSE 实时更新 API。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件,支持各种架构以及 Vulkan、CUDA、OpenVINO 和 SYCL 等加速框架。