В статье представлена VISTA — слой без дообучения, предназначенный для решения ограничений окна контекста долгосрочных инструментальных агентов за счёт раскрытия их внутреннего состояния. Утверждается, что передовые модели не видят собственного использования контекста, и предлагается интерфейс, отображающий детали рабочей памяти вместо опирания на выученные политики сжатия.
- VISTA представляет рабочую память в виде типизированных адресуемых блоков и предоставляет дашборд времени выполнения, показывающий использование токенов по блокам, свежесть и историю доступа.
- Система архивирует блоки как восстанавливаемые полноразмерные данные без необходимости дообучения модели.
- На LOCA-Bench интерфейс улучшил четыре бэкбона, подняв производительность Gemini-3-Flash с 22,7% до 50,7%.
- Прирост производительности увеличивается при росте нагрузки на контекст и переносится на траектории масштаба в миллион, 100 тысяч и 10 тысяч на LOCA-Bench, BrowseComp-Plus и GAIA.
Этот подход позволяет моделям принимать обоснованные решения о сохранении или отбрасывании данных, предоставляя видимость собственного состояния контекста, что устраняет пробел, оставленный предыдущими методами управления, контролируемыми системой.