Um usuário compartilha uma arquitetura de agente baseada em navegador que melhora o desempenho de modelos de linguagem locais menores ao restringir sua visualização a "aplicações" ou fluxos de trabalho dedicados com conjuntos limitados de ferramentas.
- O sistema substitui dezenas de ferramentas gerais por interfaces focadas, como um navegador web apenas de texto e um aplicativo de controle do computador, cada um mantendo estado persistente.
- Essa abordagem evita que modelos menores cometam erros em texto exato como URLs ao usar navegação simples verbo-número dentro do escopo confinado.
- Testes no Gemma 4 E4B mostraram melhor desempenho do que o Gemma 4 26B sob essa configuração, pois o modelo maior exibiu aversão a ferramentas de planejamento dedicadas.
- O agente retém o contexto completo ao sair dessas aplicações, permitindo acessar um conjunto mais amplo de ~100 ferramentas em um modo geral.
O autor sugere que essa arquitetura ajuda modelos menores a gerenciar tarefas complexas reduzindo ruído de contexto e sobrecarga de ferramentas.