llama.cpp 版本 b9668 实现了 UMA 主机可见内存缓冲区,以改善 UMA 设备上的性能,基于 0cc4m 的建议。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持 CPU、Vulkan、ROCm、OpenVINO、SYCL 和 HIP,并附带专用 UI 包。