Liberación llama.cpp b9804: correcciones de Mamba2 y nuevos binarios
La liberación llama.cpp b9804 introduce una corrección para la arquitectura Mamba2 al eliminar un factor de expansión codificado en 2x y una comprobación de parámetros no válida, permitiendo el soporte para cualquier valor de expand. Este cambio actualiza el script `convert_hf_to_gguf.py` para hacer que el parámetro expand sea opcional con un valor predeterminado de 2.