La version b9817 de llama.cpp met à jour le backend OpenVINO vers la version 2026.2.1 et rend ses packages de release autonomes. Cette mise à jour inclut plusieurs améliorations d'opérateurs au sein du backend OpenVINO, telles que la suppression des ensembles compute_op_type codés en dur et l'activation de softmax avec entrée sink.
- Mise à jour vers OpenVINO 2026.2.1 avec des packages de release autonomes.
- Suppression des ensembles compute_op_type codés en dur dans le backend OpenVINO.
- Activation du support softmax avec entrée sink.
- Optimisation du processus de conversion mul_mat_id pour les grandes tailles.
- Modification de add_id pour prendre en charge les entrées 2D/4D.
- Ajout du support de l'opérateur glu_swiglu_oai.
La release fournit des binaires précompilés pour macOS (Apple Silicon et Intel), iOS, Linux (Ubuntu x64, arm64, s390x), Android, Windows (CPU, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) et openEuler sur diverses architectures CPU.