llama.cpp 版本 b9704 现在对无效语法返回 HTTP 400,而不是静默丢弃约束。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,涵盖多种架构和硬件加速器,支持 Vulkan、ROCm、OpenVINO、SYCL 和 CUDA。