Lançamento b9804 do llama.cpp: Correções para Mamba2 e novos binários

O lançamento b9804 do llama.cpp introduz uma correção para a arquitetura Mamba2, removendo um fator de expansão fixo de 2x e uma verificação de parâmetro inválida, permitindo suporte para qualquer valor de expansão. Esta alteração atualiza o script `convert_hf_to_gguf.py` para tornar o parâmetro expand opcional, com um padrão de 2.

O lançamento fornece binários para macOS (Apple Silicon e Intel), iOS, Linux (Ubuntu x64, arm64, s390x), Android (arm64), Windows (CPU, CUDA 12/13, Vulkan, OpenCL, ROCm, SYCL, OpenVINO) e openEuler.

Esta atualização garante maior compatibilidade para modelos Mamba2 ao remover verificações de configuração restritivas, mantendo um amplo suporte a plataformas em backends de CPU e GPU.