DMV-Bench: Диагностика визуальной памяти мультимодальных агентов с длинным горизонтом через инъекцию инцидентальных подсказок
Исследователи представляют DMV-Bench, первый интерактивный бенчмарк, разработанный для оценки визуальной памяти мультимодальных агентов в контролируемых условиях. В исследовании предлагается DualMem — архитектура параллельной визуальной и вербальной памяти, которая значительно превосходит существующие системы на этом новом диагностическом инструменте.