LLaMA.cpp b9678 版本包含对 mul_mat_f16_f32_l4 的解码优化,并引入了适用于 macOS、Linux、Android、Windows 和 openEuler 的新构建。该版本在多种架构上提供 CPU、Vulkan、ROCm、OpenVINO、SYCL 和 HIP 支持,并提供专用的 UI 包。