El proyecto llama.cpp ha lanzado la versión b9835, que incluye una corrección para la funcionalidad de detención y omisión del razonamiento en el modo de modelo único. Esta actualización aborda problemas específicos dentro de la interfaz de usuario para mejorar el control durante la inferencia del modelo.
- macOS: Binarios proporcionados para Apple Silicon (arm64) e Intel (x64), con KleidiAI deshabilitado en Apple Silicon; se incluye XCFramework para iOS.
- Linux: Compilaciones disponibles para Ubuntu x64 y arm64 (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16).
- Android: Binario de CPU proporcionado para la arquitectura arm64.
- Windows: Binarios para CPUs x64 y arm64, además de soporte para GPU mediante CUDA 12/13, Vulkan, OpenCL Adreno, OpenVINO, SYCL e HIP.
- openEuler: Compilaciones para x86 (310p, 910b ACL Graph) y aarch64 (310p, 910b ACL Graph), con soporte estándar deshabilitado.
El lanzamiento asegura una mayor compatibilidad de hardware entre múltiples sistemas operativos y aceleradores, mientras corrige el comportamiento de la interfaz en escenarios de modelo único.