Un utilisateur partage une architecture d'agent basée sur le navigateur qui améliore les performances des petits modèles de langage locaux en restreignant leur vue à des "applications" ou workflows dédiés avec des ensembles d'outils limités.
- Le système remplace des dizaines d'outils généraux par des interfaces ciblées, telles qu'un navigateur web uniquement texte et une application de contrôle informatique, chacune maintenant un état persistant.
- Cette approche empêche les petits modèles de faire des erreurs dans le texte exact comme les URL en utilisant une navigation simple verbe-numéro à l'intérieur du périmètre confiné.
- Les tests sur Gemma 4 E4B ont montré de meilleures performances que Gemma 4 26B dans cette configuration, car le modèle plus grand présentait une aversion pour les outils de planification dédiés.
- L'agent conserve le contexte complet en quittant ces applications, lui permettant d'accéder à un ensemble plus large d'environ 100 outils en mode général.
L'auteur suggère que cette architecture aide les petits modèles à gérer des tâches complexes en réduisant le bruit de contexte et la surcharge d'outils.