연구자들은 ScopeEdit을 제안했습니다. 이는 스코프 인식형 온라인 편집기로, 각 업데이트의 전파 경계를 제어함으로써 멀티모달 대규모 언어 모델(MLLM) 편집을 재정의하며, 단순히 인스턴스를 수정하는 것을 넘어섭니다. 이 방법은 업데이트를 모달리티 로컬 흡수 분기 및 증거 게이트 공유 일반화 분기로 분해하여 크로스모달 전이를 관리합니다.

  • ScopeEdit은 스코프 분리된 쓰기 기하학을 위해 직교 저랭크 공간을 사용하고, 프리컨디셔너에는 Sherman--Morrison 재귀를 사용하여 편집당 일정 오버헤드를 제공합니다.
  • 공유 분기는 시각적 증거와 텍스트적 증거가 충분히 정렬될 때만 크로스모달 전파를 허용합니다.
  • 다양한 벤치마크 및 장기 편집 스트림에 대한 실험은 스코프 내 전이와 스코프 외 국소성 간의 개선된 트레이드오프를 보여주며 신뢰성과 안정성을 유지합니다.

이 접근 방식은 관련 없는 입력으로의 누출을 방지하고 업데이트가 의도한 의미적 경계를 넘어 일반화되지 않도록 보장함으로써 기존 편집기의 스코프 격차를 해결합니다.