Rilis llama.cpp b9817 memperbarui backend OpenVINO ke versi 2026.2.1 dan membuat paket rilis menjadi mandiri (self-contained). Pembaruan ini mencakup beberapa peningkatan operator di dalam backend OpenVINO, seperti menghapus set compute_op_type yang dikodekan secara keras (hardcoded) serta mengaktifkan softmax dengan input sink.

  • Pembaruan ke OpenVINO 2026.2.1 dengan paket rilis mandiri.
  • Menghapus set compute_op_type yang dikodekan secara keras di backend OpenVINO.
  • Mengaktifkan dukungan input sink untuk softmax.
  • Mengoptimalkan proses konversi mul_mat_id untuk ukuran besar.
  • Memodifikasi add_id agar mendukung input 2D/4D.
  • Menambahkan dukungan operator glu_swiglu_oai.

Rilis ini menyediakan biner pra-bangun untuk macOS (Apple Silicon dan Intel), iOS, Linux (Ubuntu x64, arm64, s390x), Android, Windows (CPU, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP), dan openEuler di berbagai arsitektur CPU.