Селективное удержание памяти для агентов LLM с длинным горизонтом

В статье представлен TraceRetain — легковесная система для ограниченной внешней памяти в замороженных агентах LLM, которая оценивает и вытесняет записи на основе интерпретируемых признаков, таких как успешность и избыточность. Исследование оценивает, как политики удержания влияют на производительность при использовании внешней памяти для усиления языковых моделей.

На чистом ALFWorld с gpt-5-mini внешняя память улучшает результаты по сравнению с отсутствием памяти, но различия между политиками ограниченного удержания находятся в пределах доверительных интервалов Уилсона 95%.
При контролируемом стрессовом тесте с записями с ошибками и 75% синтетических помех неограниченная память и FIFO-K50 значительно ухудшают Precision@5.
TraceRetain-CEM остается практически неизменным при наличии шума, сохраняя 97 из 100 успешных задач при поддержании точности.
Оценка на отложенной выборке из того же распределения показывает, что политики с усиленной памятью решают 47–49 из 50 задач по сравнению с 39 без памяти.

Ограниченное удержание улучшает эффективность памяти и шагов на насыщенных бенчмарках без ущерба для успешности задач, отличаясь от эвристик кэша преимущественно в потоках данных с шумом.