El proyecto llama.cpp ha lanzado la versión b9814, que incluye una optimización para la operación `mul_mat_vecq` en Vulkan dirigida específicamente a la GPU AMD mi50. Esta actualización viene acompañada de un conjunto completo de binarios precompilados para múltiples sistemas operativos y arquitecturas de hardware.
- Las compilaciones para macOS Apple Silicon (arm64) e Intel (x64) están disponibles, con el soporte de KleidiAI deshabilitado para Apple Silicon.
- Los binarios de Linux cubren Ubuntu x64 y arm64 CPU, Vulkan, ROCm 7.2, OpenVINO y variantes SYCL FP32/FP16.
- Las versiones para Windows incluyen backends de CPU, OpenCL Adreno, CUDA 12.4 y 13.3, Vulkan, OpenVINO, SYCL e HIP.
- Se proporcionan compilaciones para Android arm64 (CPU) y openEuler x86/aarch64 para los chips 310p y 910b, con la compilación estándar de openEuler x86 deshabilitada.
Este lanzamiento permite a los usuarios ejecutar llama.cpp en una amplia variedad de configuraciones de hardware, incluidas optimizaciones específicas para GPUs AMD a través de Vulkan.