Выпуск llama.cpp b9804 вносит исправление для архитектуры Mamba2, удаляя жёстко заданный коэффициент расширения 2x и некорректную проверку параметров, что позволяет поддерживать любое значение expand. Это изменение обновляет скрипт `convert_hf_to_gguf.py`, делая параметр expand необязательным со значением по умолчанию 2.
Выпуск предоставляет бинарные файлы для macOS (Apple Silicon и Intel), iOS, Linux (Ubuntu x64, arm64, s390x), Android (arm64), Windows (CPU, CUDA 12/13, Vulkan, OpenCL, ROCm, SYCL, OpenVINO) и openEuler.
Это обновление обеспечивает более широкую совместимость для моделей Mamba2 за счёт удаления ограничительных проверок конфигурации при сохранении обширной поддержки платформ на базе CPU и GPU.