github llama.cpp · 10 天前 · inference

llama.cpp 发布 b9747，新增实时模型加载跟踪和新平台二进制文件

译自 English → 中文

llama.cpp 版本 b9747 通过 SSE 端点引入了实时模型加载进度跟踪。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件，支持各种架构以及 Vulkan、CUDA、OpenVINO 和 SYCL 等加速技术。

重要性 0/3 可信度 2/3 llama.cpp