O projeto llama.cpp lançou a versão b9816, que inclui uma sincronização com a biblioteca ggml. Esta atualização fornece binários pré-compilados para as plataformas macOS, iOS, Linux, Windows, Android e openEuler.
- Estão disponíveis compilações para macOS Apple Silicon (arm64) e Intel (x64), enquanto o suporte ao KleidiAI está desativado.
- Os binários do Linux abrangem CPU x64 e arm64 do Ubuntu, Vulkan, ROCm 7.2, OpenVINO e variantes SYCL FP32/FP16.
- As versões para Windows incluem opções de CPU, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL, HIP e OpenCL Adreno.
- Binários Android arm64 (CPU) e iOS XCFramework são fornecidos para implantação em dispositivos móveis.
- O suporte ao openEuler inclui compilações x86 e aarch64 com ACL Graph, embora o openEuler padrão esteja desativado.
Este lançamento permite que os usuários executem o llama.cpp em uma ampla variedade de arquiteturas de hardware e sistemas operacionais usando o backend ggml mais recente.