llama.cpp b9804 リリースは、Mamba2 アーキテクチャの修正を導入しました。これは、ハードコードされた 2 倍の展開係数と無効なパラメータチェックを削除し、任意の展開値をサポート可能にします。この変更により、`convert_hf_to_gguf.py` スクリプトが更新され、展開パラメータがデフォルト値 2 でオプションとなりました。
本リリースでは、macOS (Apple Silicon および Intel)、iOS、Linux (Ubuntu x64、arm64、s390x)、Android (arm64)、Windows (CPU、CUDA 12/13、Vulkan、OpenCL、ROCm、SYCL、OpenVINO)、および openEuler 用のバイナリが提供されます。
この更新により、制限的な構成チェックを削除しつつ、CPU および GPU バックエンド全体にわたる広範なプラットフォームサポートを維持することで、Mamba2 モデルの互換性が向上しました。