Исследователи предлагают ScopeEdit, онлайн-редактор, учитывающий область применения, который переосмысливает редактирование мультимодальных больших языковых моделей (MLLM), контролируя границу распространения каждого обновления вместо простой коррекции отдельных случаев. Метод разбивает обновления на ветвь поглощения, локальную для модальности, и общую ветвь обобщения с гейтом по доказательствам для управления кросс-модальной передачей.

  • ScopeEdit использует ортогональные пространства низкого ранга для геометрии записи, разделённой по области, и рекурсии Шермана–Моррисона для предобусловливателей, обеспечивая постоянные накладные расходы на каждое обновление.
  • Общая ветвь позволяет кросс-модальное распространение только тогда, когда визуальные и текстовые доказательства достаточно согласованы.
  • Эксперименты на разнообразных бенчмарках и длинных потоках обновлений показывают улучшенный баланс между передачей в пределах области и локальностью вне её, сохраняя надёжность и стабильность.

Подход решает проблему разрыва областей в существующих редакторах, предотвращая утечку на нерелевантные входные данные и гарантируя, что обновления не обобщаются за пределы их предполагаемой семантической границы.