Исследователи предлагают ScopeEdit, онлайн-редактор, учитывающий область применения, который переосмысливает редактирование мультимодальных больших языковых моделей (MLLM), контролируя границу распространения каждого обновления вместо простой коррекции отдельных случаев. Метод разбивает обновления на ветвь поглощения, локальную для модальности, и общую ветвь обобщения с гейтом по доказательствам для управления кросс-модальной передачей.
- ScopeEdit использует ортогональные пространства низкого ранга для геометрии записи, разделённой по области, и рекурсии Шермана–Моррисона для предобусловливателей, обеспечивая постоянные накладные расходы на каждое обновление.
- Общая ветвь позволяет кросс-модальное распространение только тогда, когда визуальные и текстовые доказательства достаточно согласованы.
- Эксперименты на разнообразных бенчмарках и длинных потоках обновлений показывают улучшенный баланс между передачей в пределах области и локальностью вне её, сохраняя надёжность и стабильность.
Подход решает проблему разрыва областей в существующих редакторах, предотвращая утечку на нерелевантные входные данные и гарантируя, что обновления не обобщаются за пределы их предполагаемой семантической границы.