Lançamento b9816 do llama.cpp: Sincronização com ggml e novos binários

O projeto llama.cpp lançou a versão b9816, que inclui uma sincronização com a biblioteca ggml. Esta atualização fornece binários pré-compilados para as plataformas macOS, iOS, Linux, Windows, Android e openEuler.

Estão disponíveis compilações para macOS Apple Silicon (arm64) e Intel (x64), enquanto o suporte ao KleidiAI está desativado.
Os binários do Linux abrangem CPU x64 e arm64 do Ubuntu, Vulkan, ROCm 7.2, OpenVINO e variantes SYCL FP32/FP16.
As versões para Windows incluem opções de CPU, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL, HIP e OpenCL Adreno.
Binários Android arm64 (CPU) e iOS XCFramework são fornecidos para implantação em dispositivos móveis.
O suporte ao openEuler inclui compilações x86 e aarch64 com ACL Graph, embora o openEuler padrão esteja desativado.

Este lançamento permite que os usuários executem o llama.cpp em uma ampla variedade de arquiteturas de hardware e sistemas operacionais usando o backend ggml mais recente.