Выпуск llama.cpp b9817 обновляет бэкенд OpenVINO до версии 2026.2.1 и делает его релизные пакеты самодостаточными. Это обновление включает несколько улучшений операторов внутри бэкенда OpenVINO, таких как удаление жёстко заданных наборов compute_op_type и включение softmax с поддержкой sink input.
- Обновление до OpenVINO 2026.2.1 с самодостаточными релизными пакетами.
- Удаление жёстко заданных наборов compute_op_type в бэкенде OpenVINO.
- Включение поддержки softmax с sink input.
- Оптимизация процесса преобразования mul_mat_id для больших размеров.
- Изменение add_id для поддержки 2D/4D входных данных.
- Добавление поддержки оператора glu_swiglu_oai.
Релиз предоставляет предварительно собранные бинарные файлы для macOS (Apple Silicon и Intel), iOS, Linux (Ubuntu x64, arm64, s390x), Android, Windows (CPU, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) и openEuler для различных архитектур CPU.