Выпуск llama.cpp b9850 вносит обновления поддержки конкретных моделей, включая регистрацию тензора t_layer_inp для Qwen3Next, исправление назначения входных данных в цикле обработки слоев и устранение проблем DFLASH для qwen-coder-next. Также добавлен тензор для нормализации внимания в модели Qwen3.

  • Доступны бинарные файлы для macOS Apple Silicon (arm64), при этом поддержка KleidiAI отключена.
  • Сборки Linux охватывают Ubuntu x64 и arm64 CPU, Vulkan, ROCm 7.2, OpenVINO и варианты SYCL FP32/FP16.
  • Предоставлены бинарные файлы Android arm64 CPU для мобильных устройств.
  • Релизы Windows включают бэкенды CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL и HIP.
  • Включены сборки openEuler для архитектур x86 и aarch64 с поддержкой ACL Graph.

Это обновление предоставляет пользователям исправленную обработку моделей серии Qwen3 и расширенные возможности аппаратного ускорения на нескольких операционных системах и архитектурах GPU.