llama.cpp b9682 版本为 Linux 和 Windows 引入了 Vulkan 支持,实现了 GPU 加速。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,涵盖多种架构,并提供 CPU 和 GPU 选项,包括 CUDA、OpenVINO、SYCL 和 ROCm。