Les chercheurs proposent ScopeEdit, un éditeur en ligne sensible à la portée qui reformule l'édition des modèles de langage multimodaux (MLLM) en contrôlant la frontière de propagation de chaque mise à jour plutôt que de se contenter de corriger des instances. La méthode décompose les mises à jour en une branche d'absorption locale au modalité et une branche de généralisation partagée à porteuse d'évidence pour gérer le transfert inter-modal.
- ScopeEdit utilise des espaces bas-rank orthogonaux pour des géométries d'écriture séparées par portée et des récurrences Sherman--Morrison pour les préconditionneurs, offrant un surcoût constant par édition.
- La branche partagée permet la propagation inter-modalement uniquement lorsque les preuves visuelles et textuelles sont suffisamment alignées.
- Les expériences sur divers benchmarks et flux d'édition à long terme montrent des compromis améliorés entre le transfert intra-portée et la localité hors-portée, tout en préservant la fiabilité et la stabilité.
L'approche comble l'écart de portée dans les éditeurs existants en empêchant les fuites vers des entrées non pertinentes et en garantissant que les modifications ne se généralisent pas au-delà de leur frontière sémantique prévue.