Rilis llama.cpp b9850 memperkenalkan pembaruan dukungan model spesifik, termasuk pendaftaran tensor t_layer_inp untuk Qwen3Next, memperbaiki penugasan input dalam loop pemrosesan layer, dan menangani masalah DFLASH untuk qwen-coder-next. Ini juga menambahkan tensor untuk normalisasi perhatian pada model Qwen3.

  • Biner macOS Apple Silicon (arm64) tersedia, sementara dukungan KleidiAI dinonaktifkan.
  • Build Linux mencakup Ubuntu x64 dan CPU arm64, Vulkan, ROCm 7.2, OpenVINO, dan varian SYCL FP32/FP16.
  • Biner Android arm64 CPU disediakan untuk perangkat seluler.
  • Rilis Windows mencakup backend CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL, dan HIP.
  • Build openEuler untuk arsitektur x86 dan aarch64 dengan dukungan ACL Graph disertakan.

Pembaruan ini memberikan kepada pengguna penanganan model yang diperbaiki untuk seri Qwen3 dan opsi akselerasi perangkat keras yang lebih luas di berbagai sistem operasi dan arsitektur GPU.