la versión b9870 de llama.cpp corrige los bucles del analizador de StepFun

El proyecto llama.cpp ha lanzado la versión b9870, que incluye una corrección para los bucles largos de razonamiento causados por el analizador de StepFun. La actualización desplaza la lógica de recorte de mensajes antes del renderizado para manejar adecuadamente las partes del contenido y los espacios en blanco.

Corrige los bucles largos de razonamiento recortando los mensajes enviados al analizador de StepFun antes del renderizado.
Aplica el recorte al texto de content_parts, contenido de cadena y reasoning_content.
Añade una prueba de regresión para las partes del contenido y elimina una plantilla duplicada.
Desactiva las compilaciones para macOS Apple Silicon (arm64, con KleidiAI habilitado).

Esta versión proporciona binarios actualizados para macOS, Linux, Windows, Android y openEuler a través de varios backends de CPU y GPU, asegurando que la corrección del analizador esté disponible para los usuarios en las plataformas compatibles.