El proyecto llama.cpp ha lanzado la versión b9835, que incluye una corrección para la funcionalidad de detención y omisión del razonamiento en el modo de modelo único. Esta actualización aborda problemas específicos dentro de la interfaz de usuario para mejorar el control durante la inferencia del modelo.

  • macOS: Binarios proporcionados para Apple Silicon (arm64) e Intel (x64), con KleidiAI deshabilitado en Apple Silicon; se incluye XCFramework para iOS.
  • Linux: Compilaciones disponibles para Ubuntu x64 y arm64 (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16).
  • Android: Binario de CPU proporcionado para la arquitectura arm64.
  • Windows: Binarios para CPUs x64 y arm64, además de soporte para GPU mediante CUDA 12/13, Vulkan, OpenCL Adreno, OpenVINO, SYCL e HIP.
  • openEuler: Compilaciones para x86 (310p, 910b ACL Graph) y aarch64 (310p, 910b ACL Graph), con soporte estándar deshabilitado.

El lanzamiento asegura una mayor compatibilidad de hardware entre múltiples sistemas operativos y aceleradores, mientras corrige el comportamiento de la interfaz en escenarios de modelo único.