llama.cpp release b9670 包含对 llama-graph 中 NVFP4 边缘情况的修复,例如移动 GEMM 后的 MUL 操作并将 build_ffn 限制为支持的组合。该版本提供了适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,涵盖多种架构和后端选项,包括 CUDA、Vulkan、SYCL 和 OpenVINO。
llama.cpp 发布 b9670:修复与新构建
译自 English → 中文