El proyecto llama.cpp ha lanzado la versión b9837, que introduce una nueva bandera `--reasoning-preserve` para la plantilla de chat Jinja con el fin de conservar los tokens de razonamiento. Esta actualización también incluye mensajes de ayuda corregidos y proporciona binarios precompilados para macOS, Linux, Windows, Android y openEuler en varios backends de hardware.

  • Añadida la bandera `--reasoning-preserve` a las plantillas jinja y chat para preservar el contenido del razonamiento.
  • Corregido el texto del mensaje de ayuda dentro del código fuente.
  • Desactivado el soporte de KleidiAI para las compilaciones de macOS Apple Silicon.
  • Lanzados binarios para Ubuntu (CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL), Windows (CPU, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) y macOS (Apple Silicon e Intel).

Este lanzamiento permite a los usuarios acceder a las últimas características de llama.cpp en una amplia gama de plataformas y aceleradores de hardware, mientras proporciona control específico sobre el manejo de tokens de razonamiento en las plantillas de chat.