llama.cpp b9804 release : corrections de Mamba2 et nouveaux binaires

La version b9804 de llama.cpp introduit une correction pour l'architecture Mamba2 en supprimant un facteur d'expansion codé en dur de 2x et une vérification de paramètre invalide, permettant ainsi le support de n'importe quelle valeur d'expansion. Cette modification met à jour le script `convert_hf_to_gguf.py` pour rendre le paramètre expand optionnel avec une valeur par défaut de 2.

La version fournit des binaires pour macOS (Apple Silicon et Intel), iOS, Linux (Ubuntu x64, arm64, s390x), Android (arm64), Windows (CPU, CUDA 12/13, Vulkan, OpenCL, ROCm, SYCL, OpenVINO) et openEuler.

Cette mise à jour assure une compatibilité élargie pour les modèles Mamba2 en supprimant les vérifications de configuration restrictives tout en maintenant un large support de plateforme sur les backends CPU et GPU.