Los Modelos de Mundo en Bucle (LoopWM) introducen una arquitectura en bucle que refina iterativamente los estados latentes del entorno utilizando un transformador compartido por parámetros. Este enfoque logra hasta 100 veces mayor eficiencia de parámetros en comparación con los modelos de mundo convencionales, adaptando la profundidad computacional a cada paso de predicción. LoopWM establece la profundidad latente iterativa como una nueva dimensión de escalado para la simulación del mundo.
Los Modelos de Mundo en Bucle Logran una Eficiencia de Parámetros 100 veces Mayor
Traducido del English → Español