O projeto llama.cpp lançou a versão b9810, introduzindo um mapeamento CUDA para `cublasSgemmBatched` nos cabeçalhos de fornecedores HIP/MUSA. Esta atualização é acompanhada por um conjunto abrangente de binários pré-compilados para plataformas macOS, Linux, Windows, Android e openEuler.
- Adicionado mapeamento cublasSgemmBatched para cabeçalhos de fornecedores HIP/MUSA via pull request #25033.
- Desabilitado suporte ao KleidiAI para builds de Apple Silicon no macOS.
- Fornecidos binários para Ubuntu x64/arm64/s390x (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16).
- Incluídos builds para Windows para CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL e HIP.
- Lançado XCFramework para iOS, Android arm64 (CPU) e binários para macOS Apple Silicon/Intel.
O lançamento garante ampla compatibilidade com hardware, oferecendo builds específicos para vários aceleradores como ROCm, SYCL e OpenVINO, além das versões padrão de CPU.