Lançamento b9848 do llama.cpp corrige get_rows_back no CUDA e fornece binários

O projeto llama.cpp lançou a versão b9848, que inclui uma correção crítica para o backend CUDA para resolver problemas com a função `get_rows_back` em tabelas com mais de 65535 linhas. Esta atualização corrige erros de clamping grid-y e stride que anteriormente afetavam operações em grandes tabelas.

Corrigido o `get_rows_back` do CUDA para tabelas com mais de 65535 linhas, corrigindo a lógica de clamp grid-y e stride (PR #25103).
O suporte ao KleidiAI para Apple Silicon no macOS está DESATIVADO nesta versão.
As builds padrão do openEuler estão DESATIVADAS, mas builds específicas para x86 (310p, 910b ACL Graph) e aarch64 (310p, 910b ACL Graph) permanecem disponíveis.
Binários são fornecidos para macOS (Apple Silicon arm64 e Intel x64), Linux (CPU Ubuntu, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16), Android (CPU arm64), Windows (CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) e a UI standalone.

Este lançamento garante estabilidade para usuários do CUDA que manipulam grandes estruturas de dados, ao mesmo tempo que oferece binários pré-compilados abrangentes em principais sistemas operacionais e aceleradores de hardware.