llama.cpp b9817 版本将 OpenVINO 后端更新至 2026.2.1 版本,并使发布包自包含。此更新包括 OpenVINO 后端中的多项算子改进,例如移除硬编码的 compute_op_type 集合并启用带有 sink 输入的 softmax。
- 更新至 OpenVINO 2026.2.1,使用自包含的发布包。
- 移除 OpenVINO 后端中硬编码的 compute_op_type 集合。
- 启用支持 sink 输入的 softmax。
- 优化大尺寸下的 mul_mat_id 转换过程。
- 修改 add_id 以支持 2D/4D 输入。
- 添加 glu_swiglu_oai 算子支持。
该版本为 macOS(Apple Silicon 和 Intel)、iOS、Linux(Ubuntu x64、arm64、s390x)、Android、Windows(CPU、CUDA 12/13、Vulkan、OpenVINO、SYCL、HIP)以及 openEuler 在各种 CPU 架构上提供了预构建的二进制文件。