lançamento b9814 do llama.cpp com otimização de Vulkan para mi50

O projeto llama.cpp lançou a versão b9814, que inclui uma otimização para a operação `mul_mat_vecq` no Vulkan, direcionada especificamente à GPU AMD mi50. Esta atualização vem acompanhada de um conjunto abrangente de binários pré-compilados para vários sistemas operacionais e arquiteturas de hardware.

Compilações para macOS Apple Silicon (arm64) e Intel (x64) estão disponíveis, com suporte a KleidiAI desativado para Apple Silicon.
Os binários do Linux cobrem Ubuntu x64 e arm64 CPU, Vulkan, ROCm 7.2, OpenVINO e variantes SYCL FP32/FP16.
Os lançamentos para Windows incluem backends de CPU, OpenCL Adreno, CUDA 12.4 e 13.3, Vulkan, OpenVINO, SYCL e HIP.
São fornecidas compilações para Android arm64 (CPU) e openEuler x86/aarch64 para chips 310p e 910b, com a compilação padrão do openEuler x86 desativada.

Este lançamento permite que os usuários executem o llama.cpp em uma ampla variedade de configurações de hardware, incluindo otimizações específicas para GPUs AMD via Vulkan.