llama.cpp 发布了版本 b9680,包含更新的 Vulkan 支持以及适用于 macOS、Linux、Android、Windows 和 openEuler 的新二进制文件。该版本包括多种架构的 CPU 和 GPU 变体,支持 Vulkan、CUDA、OpenVINO、SYCL 和 ROCm。