llama.cppプロジェクトはバージョンb9873をリリースし、キー/バリュー回転バッファが未割り当ての場合にグラフ演算中に発生する重大なアサーション失敗に対処しました。
- テンソルポインタは非NULLだがバッファが未割り当ての場合にNULLバッファに対してggml_backend_buffer_is_host()を呼び出すことで発生する中止を修正しました。
- k_rot/v_rot入力の処理前にバッファの割り当てをチェックするガードを追加し、kq_mask入力に対する既存のチェックと一貫性を持たせました。
- DFlash推論デコーディングのKVインジェクションパスに関連する問題#25191を解決しました。
この変更により、特定の推論デコーディングパスなど、注意機構なしでK/Vを保存するワークフローでのクラッシュを防ぎ、安定した実行を保証します。