O projeto llama.cpp lançou a versão b9870, que inclui uma correção para loops de raciocínio longos causados pelo analisador do StepFun. A atualização move a lógica de corte de mensagens antes da renderização para lidar corretamente com as partes do conteúdo e espaços em branco.
- Corrige loops de raciocínio longos cortando as mensagens enviadas ao analisador do StepFun antes da renderização.
- Aplica o corte ao texto de content_parts, conteúdo de string e reasoning_content.
- Adiciona um teste de regressão para as partes do conteúdo e remove um modelo duplicado.
- Desativa builds do macOS Apple Silicon (arm64, com KleidiAI habilitado).
Este lançamento fornece binários atualizados para macOS, Linux, Windows, Android e openEuler em vários backends de CPU e GPU, garantindo que a correção do analisador esteja disponível para usuários nas plataformas suportadas.