llama.cpp 版本 b9693 在其 concat kernel 中引入了 BF16 支持,并为 macOS、Linux、Android、Windows 和 openEuler 提供了预构建的二进制文件。该版本包含 CPU、Vulkan、ROCm、OpenVINO、SYCL 和 HIP 变体,涵盖多种架构,并提供专用的 UI 包。