github llama.cpp · 16 天前 · inference

llama.cpp 发布 b9699，新增 SYCL 支持和多平台二进制文件

译自 English → 中文

llama.cpp 版本 b9699 通过 PR #24721 引入了对 MUL_MAT 和 OUT_PROD 操作的 Q1_0 精度支持。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的预编译二进制文件，覆盖多种架构和加速框架，包括 SYCL（FP32 和 FP16）、Vulkan、CUDA、ROCm 和 OpenVINO。

重要性 0/3 可信度 1/3 llama.cpp

阅读原文