El análisis de la dinámica del estado oculto en 7 LLMs de peso abierto revela patrones funcionales recurrentes
Un investigador independiente analizó la evolución de las representaciones ocultas durante la inferencia en siete modelos de peso abierto, incluyendo GPT-2, OPT-125M y Llama-3.2-1B, para identificar regímenes dinámicos internos más allá de los benchmarks de salida estándar.