Um usuário compartilha uma arquitetura de agente baseada em navegador que melhora o desempenho de modelos de linguagem locais menores ao restringir sua visualização a "aplicações" ou fluxos de trabalho dedicados com conjuntos limitados de ferramentas.

  • O sistema substitui dezenas de ferramentas gerais por interfaces focadas, como um navegador web apenas de texto e um aplicativo de controle do computador, cada um mantendo estado persistente.
  • Essa abordagem evita que modelos menores cometam erros em texto exato como URLs ao usar navegação simples verbo-número dentro do escopo confinado.
  • Testes no Gemma 4 E4B mostraram melhor desempenho do que o Gemma 4 26B sob essa configuração, pois o modelo maior exibiu aversão a ferramentas de planejamento dedicadas.
  • O agente retém o contexto completo ao sair dessas aplicações, permitindo acessar um conjunto mais amplo de ~100 ferramentas em um modo geral.

O autor sugere que essa arquitetura ajuda modelos menores a gerenciar tarefas complexas reduzindo ruído de contexto e sobrecarga de ferramentas.