la versión b9848 de llama.cpp corrige CUDA get_rows_back y proporciona binarios

El proyecto llama.cpp ha lanzado la versión b9848, que incluye una corrección crítica para el backend de CUDA para resolver problemas con la función `get_rows_back` en tablas que superan las 65535 filas. Esta actualización aborda los errores de clamping grid-y y stride que anteriormente afectaban a las operaciones con tablas grandes.

Corregido CUDA `get_rows_back` para tablas con más de 65535 filas corrigiendo la lógica de clamp grid-y y stride (PR #25103).
El soporte de macOS Apple Silicon KleidiAI está DESACTIVADO en esta versión.
Las compilaciones estándar de openEuler están DESACTIVADAS, pero las compilaciones específicas para x86 (310p, 910b ACL Graph) y aarch64 (310p, 910b ACL Graph) siguen estando disponibles.
Se proporcionan binarios para macOS (Apple Silicon arm64 e Intel x64), Linux (Ubuntu CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16), Android (arm64 CPU), Windows (CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) y la interfaz de usuario independiente.

Esta versión garantiza la estabilidad para los usuarios de CUDA que manejan estructuras de datos grandes, mientras ofrece binarios precompilados completos en los principales sistemas operativos y aceleradores de hardware.