Hacia intuiciones físicas para la dinámica de alineación: Un estudio de caso con cristalización de aleatoriedad
Este artículo propone utilizar la teoría de transiciones de fase termodinámicas para comprender la dinámica de la alineación de modelos de lenguaje durante el post-entrenamiento, específicamente a través de la lente de la cristalización de materiales. Los autores argumentan que este marco físico proporciona un vocabulario fundamentado para razonar sobre cómo cambian los modelos y de dónde origina la estructura inducida por la alineación.