O projeto llama.cpp lançou a versão b9870, que inclui uma correção para loops de raciocínio longos causados pelo analisador do StepFun. A atualização move a lógica de corte de mensagens antes da renderização para lidar corretamente com as partes do conteúdo e espaços em branco.

  • Corrige loops de raciocínio longos cortando as mensagens enviadas ao analisador do StepFun antes da renderização.
  • Aplica o corte ao texto de content_parts, conteúdo de string e reasoning_content.
  • Adiciona um teste de regressão para as partes do conteúdo e remove um modelo duplicado.
  • Desativa builds do macOS Apple Silicon (arm64, com KleidiAI habilitado).

Este lançamento fornece binários atualizados para macOS, Linux, Windows, Android e openEuler em vários backends de CPU e GPU, garantindo que a correção do analisador esteja disponível para usuários nas plataformas suportadas.