L'article démontre que les objets indexés par coordonnées dans les flux de travail des LLM nécessitent de corriger la jauge du flux résiduel du modèle, qui dépend de l'architecture. Alors que les modèles LayerNorm possèdent une jauge de permutation ($S_d$), les modèles RMSNorm ont une jauge de permutation signée ($B_d$), rendant l'alignement par permutation seule symétriquement incomplet.

  • Les auteurs introduisent la correspondance hongroise marginalisée par signe pour surmonter les plafonds de précision structurelle dans la correspondance par corrélation signée brute.
  • La composition des jauges locales $B_d$ des points de contrôle sauvegardés récupère 91,1 % des coordonnées inter-exécutions à 1500 étapes, contre 60,3 % pour la correspondance aux extrémités.
  • Sous la jauge $B_d$, la reconstruction SAE de TinyLlama atteint un NMSE de 0,004 contre 1,08 sous $S_d$, et le pilotage d'émotion de Qwen préserve 95,8 % de son effet contre 17,2 %.
  • Le transport signé de l'état AdamW préserve la trajectoire d'entraînement reprise, tandis que l'état par permutation seule suit une trajectoire différente.

Les auteurs soutiennent que le transport préservant les coordonnées est essentiel pour des outils comme les SAE et les vecteurs de pilotage qui échouent sous un alignement par permutation seule, et que les affirmations d'interprétabilité ne sont reproductibles que par rapport à une jauge explicite.