llama.cpp 版本 b9703 包括对服务器预设处理的重新设计,移除了远程 HF 预设支持和已弃用的函数。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,涵盖多种架构和硬件加速选项,包括 Vulkan、CUDA、OpenVINO 和 SYCL。