llama.cpp b9804 版本通过移除硬编码的 2x 扩展因子和无效的参数检查,引入了对 Mamba2 架构的修复,从而支持任意 expand 值。此更改更新了 `convert_hf_to_gguf.py` 脚本,使 expand 参数变为可选,默认值为 2。

该版本提供了适用于 macOS(Apple Silicon 和 Intel)、iOS、Linux(Ubuntu x64、arm64、s390x)、Android(arm64)、Windows(CPU、CUDA 12/13、Vulkan、OpenCL、ROCm、SYCL、OpenVINO)以及 openEuler 的二进制文件。

此更新通过移除限制性配置检查,同时保持对 CPU 和 GPU 后端的广泛平台支持,确保了 Mamba2 模型更广泛的兼容性。