Lanzamiento b9835 de llama.cpp con correcciones de detención en la interfaz y omisión del razonamiento

El proyecto llama.cpp ha lanzado la versión b9835, que incluye una corrección para la funcionalidad de detención y omisión del razonamiento en el modo de modelo único. Esta actualización aborda problemas específicos dentro de la interfaz de usuario para mejorar el control durante la inferencia del modelo.

macOS: Binarios proporcionados para Apple Silicon (arm64) e Intel (x64), con KleidiAI deshabilitado en Apple Silicon; se incluye XCFramework para iOS.
Linux: Compilaciones disponibles para Ubuntu x64 y arm64 (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16).
Android: Binario de CPU proporcionado para la arquitectura arm64.
Windows: Binarios para CPUs x64 y arm64, además de soporte para GPU mediante CUDA 12/13, Vulkan, OpenCL Adreno, OpenVINO, SYCL e HIP.
openEuler: Compilaciones para x86 (310p, 910b ACL Graph) y aarch64 (310p, 910b ACL Graph), con soporte estándar deshabilitado.

El lanzamiento asegura una mayor compatibilidad de hardware entre múltiples sistemas operativos y aceleradores, mientras corrige el comportamiento de la interfaz en escenarios de modelo único.