El proyecto llama.cpp ha lanzado la versión b9870, que incluye una corrección para los bucles de razonamiento largos causados por el analizador de StepFun. La actualización mueve la lógica de recorte de mensajes antes del renderizado para manejar correctamente las partes del contenido y los espacios en blanco.

  • Corrige bucles de razonamiento largos recortando los mensajes enviados al analizador de StepFun antes del renderizado.
  • Aplica el recorte al texto de content_parts, contenido de cadena y reasoning_content.
  • Añade una prueba de regresión para las partes del contenido y elimina una plantilla duplicada.
  • Desactiva las compilaciones de macOS Apple Silicon (arm64, con KleidiAI habilitado).

Esta versión proporciona binarios actualizados para macOS, Linux, Windows, Android y openEuler en varios backends de CPU y GPU, asegurando que la corrección del analizador esté disponible para los usuarios en las plataformas compatibles.