Un utilisateur partage une architecture d'agent basée sur le navigateur qui améliore les performances des petits modèles de langage locaux en restreignant leur vue à des "applications" ou workflows dédiés avec des ensembles d'outils limités.

  • Le système remplace des dizaines d'outils généraux par des interfaces ciblées, telles qu'un navigateur web uniquement texte et une application de contrôle informatique, chacune maintenant un état persistant.
  • Cette approche empêche les petits modèles de faire des erreurs dans le texte exact comme les URL en utilisant une navigation simple verbe-numéro à l'intérieur du périmètre confiné.
  • Les tests sur Gemma 4 E4B ont montré de meilleures performances que Gemma 4 26B dans cette configuration, car le modèle plus grand présentait une aversion pour les outils de planification dédiés.
  • L'agent conserve le contexte complet en quittant ces applications, lui permettant d'accéder à un ensemble plus large d'environ 100 outils en mode général.

L'auteur suggère que cette architecture aide les petits modèles à gérer des tâches complexes en réduisant le bruit de contexte et la surcharge d'outils.