El artículo presenta TraceRetain, un marco ligero para memoria externa acotada en agentes LLM congelados que puntúa y elimina entradas basándose en características interpretables como éxito y redundancia. El estudio evalúa cómo las políticas de retención impactan el rendimiento cuando se utiliza memoria externa para aumentar los modelos de lenguaje.
- En ALFWorld limpio con gpt-5-mini, la memoria externa mejora respecto a no tener memoria, pero las diferencias entre las políticas de retención acotada están dentro de los IC al 95% de Wilson.
- Bajo un estrés controlado de escritura ruidosa con 75% de distractores sintéticos, la memoria ilimitada y FIFO-K50 se degradan significativamente en Precision@5.
- TraceRetain-CEM permanece esencialmente sin cambios bajo ruido, preservando 97 de cada 100 éxitos de tarea mientras mantiene la precisión.
- La evaluación con datos fuera de muestra de la misma distribución muestra que las políticas aumentadas con memoria resuelven de 47 a 49 de 50 tareas en comparación con 39 para no tener memoria.
La retención acotada mejora la eficiencia de memoria y pasos en benchmarks saturados sin costar el éxito de la tarea, diferenciándose principalmente de las heurísticas de caché cuando los flujos de datos contienen ruido.