Este estudio investiga el aprendizaje estadístico y la representación mental de los modelos de lenguaje neuronales mediante el entrenamiento de modelos Transformer generativos en una gramática sintética y el análisis de sus representaciones internas en diversas etapas.
- Los NLM adquieren el conocimiento estadístico global más abstracto al inicio del aprendizaje, seguido de dependencias estadísticas relativamente locales posteriormente.
- La trayectoria de aprendizaje implica muchas sobre-generalizaciones desde el inicio que se van restringiendo gradualmente en las etapas posteriores.
- Se propone un nuevo marco para explicar el aprendizaje estadístico y la cognición del lenguaje de los NLM basándose en estas observaciones.