llama.cpp b9870 リリースが StepFun パーサーのループを修正

llama.cpp プロジェクトはバージョン b9870 をリリースしました。これには、StepFun パーサーによって引き起こされる長い推論ループの修正が含まれています。このアップデートでは、コンテンツ部分と空白を適切に処理するために、メッセージのトリミングロジックがレンダリングの前に移動されました。

レンダリング前に StepFun パーサーに送信されるメッセージをトリミングすることで、長い推論ループを修正します。
content_parts テキスト、文字列コンテンツ、および reasoning_content にトリミングを適用します。
コンテンツ部分の回帰テストを追加し、重複するテンプレートを削除します。
macOS Apple Silicon (arm64, KleidiAI 有効) のビルドを無効にします。

このリリースでは、macOS、Linux、Windows、Android、openEuler 向けの更新されたバイナリが提供され、様々な CPU および GPU バックエンドで、サポートされているプラットフォーム上のユーザーがパーサーの修正を利用できるようになります。