llama.cpp プロジェクトはバージョン b9870 をリリースしました。これには、StepFun パーサーによって引き起こされる長い推論ループの修正が含まれています。このアップデートでは、コンテンツ部分と空白を適切に処理するために、メッセージのトリミングロジックがレンダリングの前に移動されました。

  • レンダリング前に StepFun パーサーに送信されるメッセージをトリミングすることで、長い推論ループを修正します。
  • content_parts テキスト、文字列コンテンツ、および reasoning_content にトリミングを適用します。
  • コンテンツ部分の回帰テストを追加し、重複するテンプレートを削除します。
  • macOS Apple Silicon (arm64, KleidiAI 有効) のビルドを無効にします。

このリリースでは、macOS、Linux、Windows、Android、openEuler 向けの更新されたバイナリが提供され、様々な CPU および GPU バックエンドで、サポートされているプラットフォーム上のユーザーがパーサーの修正を利用できるようになります。