Lançamento b9870 do llama.cpp corrige loops do parser StepFun

O projeto llama.cpp lançou a versão b9870, que inclui uma correção para loops longos de raciocínio causados pelo parser StepFun. A atualização move a lógica de trimagem de mensagens antes da renderização para lidar corretamente com partes do conteúdo e espaços em branco.

Corrige loops longos de raciocínio ao realizar trimagem nas mensagens enviadas ao parser StepFun antes da renderização.
Aplica trimagem ao texto das content_parts, conteúdo em string e reasoning_content.
Adiciona um teste de regressão para partes do conteúdo e remove um modelo duplicado.
Desativa builds para macOS Apple Silicon (arm64, com KleidiAI habilitado).

Este lançamento fornece binários atualizados para macOS, Linux, Windows, Android e openEuler em vários backends de CPU e GPU, garantindo que a correção do parser esteja disponível para usuários nas plataformas suportadas.