研究者らは、ScopeEditを提案した。これはスコープ認識型のオンラインエディタであり、各更新の伝播境界を制御することでマルチモーダル大規模言語モデル(MLLM)の編集を再定義し、単にインスタンスを修正するだけでなく対応する。この手法は、更新をモダリティローカルの吸収ブランチと証拠ゲート付き共有一般化ブランチに分解し、クロスモーダル転移を管理する。

  • ScopeEditは、スコープ分離された書き込み幾何学のために直交低ランク空間を使用し、プリコンディショナーにはSherman--Morrison再帰を用い、編集あたりの一定のオーバーヘッドを実現する。
  • 共有ブランチは、視覚的証拠とテキスト的証拠が十分に整列している場合にのみクロスモーダル伝播を可能にする。
  • 多様なベンチマークおよび長期にわたる編集ストリームでの実験により、スコープ内転移とスコープ外局所性の間の改善されたトレードオフが示され、信頼性と安定性が維持されている。

このアプローチは、関連しない入力へのリークを防ぎ、更新が意図した意味的境界を超えて一般化しないことを保証することで、既存のエディタのスコープギャップに対処する。