GateMem представляет бенчмарк для агентов с общей памятью, действующих в интересах нескольких принципалов, оценивающий полезность, контроль доступа и активное забвение в областях медицины, офиса, образования и домашнего хозяйства. Никакой метод не достигает сильной производительности по всем трём аспектам управления, при этом использование длинных контекстов показывает лучшие результаты при высокой стоимости, в то время как методы на основе извлечения и внешней памяти снижают стоимость, но все еще страдают от утечек информации.