Выпуск llama.cpp b9817 обновляет бэкенд OpenVINO до версии 2026.2.1 и делает его релизные пакеты самодостаточными. Это обновление включает несколько улучшений операторов внутри бэкенда OpenVINO, таких как удаление жёстко заданных наборов compute_op_type и включение softmax с поддержкой sink input.

  • Обновление до OpenVINO 2026.2.1 с самодостаточными релизными пакетами.
  • Удаление жёстко заданных наборов compute_op_type в бэкенде OpenVINO.
  • Включение поддержки softmax с sink input.
  • Оптимизация процесса преобразования mul_mat_id для больших размеров.
  • Изменение add_id для поддержки 2D/4D входных данных.
  • Добавление поддержки оператора glu_swiglu_oai.

Релиз предоставляет предварительно собранные бинарные файлы для macOS (Apple Silicon и Intel), iOS, Linux (Ubuntu x64, arm64, s390x), Android, Windows (CPU, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) и openEuler для различных архитектур CPU.