llama.cppのプルリクエストは、入力のトリミングが誤って実装されていた問題を解決するもので、これは以前にStep 3.7 Flashのパフォーマンスを阻害していました。
- この修正は、推論能力の低下を引き起こした入力処理の特定のバグを対象としています。
- この変更は、長い形式の推論が必要なタスクでモデルを使用可能にすることを目指しています。
このアップデートは、Step 3.5 Flashなどの以前のバージョンと比較してパフォーマンスが悪かったため、Step 3.7 Flashを避けていたユーザーにとって重要です。