Supersede: Diagnosticar y entrenar la brecha de actualización de memoria en agentes LLM

Este artículo identifica un modo de fallo distinto en agentes de modelos de lenguaje grandes donde tienen dificultades para descartar hechos obsoletos en favor de los actuales, incluso cuando la comprensión está intacta. Los autores demuestran que esta "brecha de supresión" persiste a través de las escalas del modelo y los tamaños de memoria, lo que indica que es un cuello de botella entrenable en lugar de una limitación de la ventana de contexto o la fuerza del modelo.

Reemplazar el contexto completo con memoria acotada en LongMemEval reduce la precisión de 92% a 77% para GPT-5.4, una brecha estadísticamente significativa (p<0.005).
A medida que la longitud de la conversación aumenta 24x, la precisión cae aún más de 68% a 28%, y otorgar proporcionalmente más memoria no produce recuperación.
Los autores lanzan Supersede, un entorno de aprendizaje por refuerzo abierto que recompensa a los agentes por usar valores actuales y penaliza los obsoletos.
El ajuste fino GRPO de Qwen2.5-3B en este entorno casi duplica la precisión de supresión en datos no vistos de 9.0% a 16.7%.

Este trabajo proporciona la primera evidencia de que la brecha de actualización de memoria puede ser reducida mediante entrenamiento usando una señal de recompensa dirigida a la actualidad temporal de los hechos, en lugar de simplemente medida.