Este artículo reinterpreta los Modelos de Lenguaje Grandes como Memorias Asociativas Densas de alta dimensión donde el razonamiento correcto corresponde a cuencas de atracción profundas en el paisaje de energía. Los autores introducen un mecanismo de recuperación que muestrea múltiples trayectorias de razonamiento y las pondera por energía inversa para aproximar la distribución de equilibrio.

  • Las cadenas de razonamiento correctas se modelan como cuencas de atracción profundas y anchas, mientras que las alucinaciones se tratan como mínimos locales agudos e inestables.
  • Se utiliza una medida de Gibbs de entropía espectral para ponderar las trayectorias de razonamiento por su energía inversa ($P \propto e^{-\beta E}$).
  • Este mecanismo inspirado en la física mejora el rendimiento de Microsoft Phi-3.5 en GSM8K del 84,7% al 90,1%, un aumento del 5,38%.

El estudio demuestra que la inferencia se modela con mayor precisión como un proceso dinámico de asentamiento en una cuenca de atractor en lugar de la predicción codiciosa del siguiente token.