Выпуск llama.cpp b9850: исправления для Qwen3 и новые бинарные файлы

Выпуск llama.cpp b9850 вносит обновления поддержки конкретных моделей, включая регистрацию тензора t_layer_inp для Qwen3Next, исправление назначения входных данных в цикле обработки слоев и устранение проблем DFLASH для qwen-coder-next. Также добавлен тензор для нормализации внимания в модели Qwen3.

Доступны бинарные файлы для macOS Apple Silicon (arm64), при этом поддержка KleidiAI отключена.
Сборки Linux охватывают Ubuntu x64 и arm64 CPU, Vulkan, ROCm 7.2, OpenVINO и варианты SYCL FP32/FP16.
Предоставлены бинарные файлы Android arm64 CPU для мобильных устройств.
Релизы Windows включают бэкенды CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL и HIP.
Включены сборки openEuler для архитектур x86 и aarch64 с поддержкой ACL Graph.

Это обновление предоставляет пользователям исправленную обработку моделей серии Qwen3 и расширенные возможности аппаратного ускорения на нескольких операционных системах и архитектурах GPU.