O projeto llama.cpp lançou a versão b9848, que inclui uma correção crítica para o backend CUDA para resolver problemas com a função `get_rows_back` em tabelas com mais de 65535 linhas. Esta atualização corrige erros de clamping grid-y e stride que anteriormente afetavam operações em grandes tabelas.
- Corrigido o `get_rows_back` do CUDA para tabelas com mais de 65535 linhas, corrigindo a lógica de clamp grid-y e stride (PR #25103).
- O suporte ao KleidiAI para Apple Silicon no macOS está DESATIVADO nesta versão.
- As builds padrão do openEuler estão DESATIVADAS, mas builds específicas para x86 (310p, 910b ACL Graph) e aarch64 (310p, 910b ACL Graph) permanecem disponíveis.
- Binários são fornecidos para macOS (Apple Silicon arm64 e Intel x64), Linux (CPU Ubuntu, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16), Android (CPU arm64), Windows (CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) e a UI standalone.
Este lançamento garante estabilidade para usuários do CUDA que manipulam grandes estruturas de dados, ao mesmo tempo que oferece binários pré-compilados abrangentes em principais sistemas operacionais e aceleradores de hardware.