Пользователь делится браузерной архитектурой агента, которая улучшает производительность небольших локальных языковых моделей за счёт ограничения их обзора выделенными «приложениями» или рабочими процессами с ограниченными наборами инструментов.

  • Система заменяет десятки общих инструментов на специализированные интерфейсы, такие как текстовый веб-браузер и приложение управления компьютером, каждое из которых поддерживает постоянное состояние.
  • Этот подход предотвращает ошибки меньших моделей в точном тексте, например URL, за счёт простой навигации по глаголам и числам в рамках ограниченной области.
  • Тесты на Gemma 4 E4B показали лучшую производительность по сравнению с Gemma 4 26B при данной настройке, поскольку более крупная модель проявляла нежелание использовать выделанные инструменты планирования.
  • Агент сохраняет полный контекст при выходе из этих приложений, что позволяет ему получать доступ к более широкому набору ~100 инструментов в общем режиме.

Автор предполагает, что данная архитектура помогает меньшим моделям справляться со сложными задачами за счёт снижения шума контекста и перегрузки инструментами.