llama.cpp b9817 リリースでは、OpenVINO バックエンドがバージョン 2026.2.1 に更新され、リリースパッケージが自己完結型になりました。このアップデートには、OpenVINO バックエンド内のいくつかの演算子改善が含まれています。具体的には、ハードコードされた compute_op_type のセットの削除や、sink 入力に対応する softmax の有効化などです。
- OpenVINO 2026.2.1 への更新と自己完結型のリリースパッケージ
- OpenVINO バックエンドにおけるハードコードされた compute_op_type のセットの削除
- sink 入力対応の softmax を有効化
- 大規模なサイズに対する mul_mat_id 変換プロセスの最適化
- add_id の 2D/4D 入力サポートの変更
- glu_swiglu_oai 演算子のサポート追加
本リリースでは、macOS (Apple Silicon および Intel)、iOS、Linux (Ubuntu x64, arm64, s390x)、Android、Windows (CPU, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP)、および openEuler の various CPU アーキテクチャ向けに、ビルド済みバイナリが提供されています。