llama.cpp b9774 版本为 SQR、SQRT、SIN、COS、CLAMP、LEAKY_RELU 和 NORM 操作添加了 Vulkan 后端支持,并支持非连续输入。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制构建文件,涵盖多种架构及 CUDA、OpenVINO、SYCL 和 ROCm 等后端。