Lançamento b9848 do llama.cpp corrige get_rows_back no CUDA e fornece binários
O projeto llama.cpp lançou a versão b9848, que inclui uma correção crítica para o backend CUDA para resolver problemas com a função `get_rows_back` em tabelas com mais de 65535 linhas. Esta atualização corrige erros de clamping grid-y e stride que anteriormente afetavam operações em grandes tabelas.