Retención selectiva de memoria para agentes LLM de largo horizonte

El artículo presenta TraceRetain, un marco ligero para memoria externa acotada en agentes LLM congelados que puntúa y elimina entradas basándose en características interpretables como éxito y redundancia. El estudio evalúa cómo las políticas de retención impactan el rendimiento cuando se utiliza memoria externa para aumentar los modelos de lenguaje.

En ALFWorld limpio con gpt-5-mini, la memoria externa mejora respecto a no tener memoria, pero las diferencias entre las políticas de retención acotada están dentro de los IC al 95% de Wilson.
Bajo un estrés controlado de escritura ruidosa con 75% de distractores sintéticos, la memoria ilimitada y FIFO-K50 se degradan significativamente en Precision@5.
TraceRetain-CEM permanece esencialmente sin cambios bajo ruido, preservando 97 de cada 100 éxitos de tarea mientras mantiene la precisión.
La evaluación con datos fuera de muestra de la misma distribución muestra que las políticas aumentadas con memoria resuelven de 47 a 49 de 50 tareas en comparación con 39 para no tener memoria.

La retención acotada mejora la eficiencia de memoria y pasos en benchmarks saturados sin costar el éxito de la tarea, diferenciándose principalmente de las heurísticas de caché cuando los flujos de datos contienen ruido.