Este artículo reinterpreta los Modelos de Lenguaje Grandes como Memorias Asociativas Densas de alta dimensión donde el razonamiento correcto corresponde a cuencas de atracción profundas en el paisaje de energía. Los autores introducen un mecanismo de recuperación que muestrea múltiples trayectorias de razonamiento y las pondera por energía inversa para aproximar la distribución de equilibrio.
- Las cadenas de razonamiento correctas se modelan como cuencas de atracción profundas y anchas, mientras que las alucinaciones se tratan como mínimos locales agudos e inestables.
- Se utiliza una medida de Gibbs de entropía espectral para ponderar las trayectorias de razonamiento por su energía inversa ($P \propto e^{-\beta E}$).
- Este mecanismo inspirado en la física mejora el rendimiento de Microsoft Phi-3.5 en GSM8K del 84,7% al 90,1%, un aumento del 5,38%.
El estudio demuestra que la inferencia se modela con mayor precisión como un proceso dinámico de asentamiento en una cuenca de atractor en lugar de la predicción codiciosa del siguiente token.