O artigo demonstra que objetos indexados por coordenada em fluxos de trabalho de LLMs exigem a correção do calibre do fluxo residual do modelo, que depende da arquitetura. Enquanto modelos LayerNorm possuem um calibre de permutação ($S_d$), os modelos RMSNorm possuem um calibre de permutação com sinal ($B_d$), tornando a simetria de alinhamento apenas por permutação incompleta.
- Os autores introduzem o emparelhamento húngaro marginalizado por sinal para abordar os tetos de precisão estrutural no emparelhamento direto de correlação com sinal.
- A composição dos calibres locais $B_d$ de checkpoints salvos recupera 91,1% das coordenadas entre execuções em 1500 passos, comparado a 60,3% para o emparelhamento de extremidade.
Sob o calibre $B_d$, a reconstrução SAE do TinyLlama atinge um NMSE de 0,004 versus 1,08 sob $S_d$, e o direcionamento de sentimento do Qwen preserva 95,8% de seu efeito versus 17,2%.
- O transporte com sinal do estado AdamW preserva a trajetória de treinamento retomada, enquanto o estado apenas por permutação segue uma trajetória diferente.
Os autores argumentam que o transporte preservador de coordenadas é essencial para ferramentas como SAEs e vetores de direcionamento que falham sob alinhamento apenas por permutação, e que as reivindicações de interpretabilidade são reproduzíveis apenas em relação a um calibre explícito.