Lanzamiento b9814 de llama.cpp con optimización de Vulkan para mi50

El proyecto llama.cpp ha lanzado la versión b9814, que incluye una optimización para la operación `mul_mat_vecq` en Vulkan dirigida específicamente a la GPU AMD mi50. Esta actualización viene acompañada de un conjunto completo de binarios precompilados para múltiples sistemas operativos y arquitecturas de hardware.

Las compilaciones para macOS Apple Silicon (arm64) e Intel (x64) están disponibles, con el soporte de KleidiAI deshabilitado para Apple Silicon.
Los binarios de Linux cubren Ubuntu x64 y arm64 CPU, Vulkan, ROCm 7.2, OpenVINO y variantes SYCL FP32/FP16.
Las versiones para Windows incluyen backends de CPU, OpenCL Adreno, CUDA 12.4 y 13.3, Vulkan, OpenVINO, SYCL e HIP.
Se proporcionan compilaciones para Android arm64 (CPU) y openEuler x86/aarch64 para los chips 310p y 910b, con la compilación estándar de openEuler x86 deshabilitada.

Este lanzamiento permite a los usuarios ejecutar llama.cpp en una amplia variedad de configuraciones de hardware, incluidas optimizaciones específicas para GPUs AMD a través de Vulkan.