llama.cpp b9850 リリース: Qwen3 の修正と新しいバイナリ

llama.cpp b9850 リリースでは、特定のモデルサポートの更新が導入されました。これには、Qwen3Next 用の t_layer_inp テンソルの登録、レイヤー処理ループ内の入力割り当ての修正、qwen-coder-next に対する DFLASH の問題への対処が含まれます。また、Qwen3 モデルの注意機構正規化用のテンソルも追加されました。

macOS Apple Silicon (arm64) のバイナリが利用可能ですが、KleidiAI サポートは無効化されています。
Linux ビルドには Ubuntu x64 および arm64 CPU、Vulkan、ROCm 7.2、OpenVINO、SYCL FP32/FP16 バリアントが含まれます。
Android arm64 CPU のバイナリがモバイルデバイス向けに提供されています。
Windows リリースには CPU、OpenCL Adreno、CUDA 12.4/13.3、Vulkan、OpenVINO、SYCL、HIP のバックエンドが含まれます。
ACL Graph サポート付きの x86 および aarch64 アーキテクチャ向けの openEuler ビルドが含まれています。

このアップデートにより、Qwen3 シリーズモデルに対する正しいモデル処理と、複数のオペレーティングシステムおよび GPU アーキテクチャにわたる拡張されたハードウェアアクセラレーションオプションがユーザーに提供されます。