Un utilisateur démontre comment rendre les modèles plus petits plus efficaces via des workflows d'application à périmètre limité

Un utilisateur partage une architecture d'agent basée sur le navigateur qui améliore les performances des petits modèles de langage locaux en restreignant leur vue à des "applications" ou workflows dédiés avec des ensembles d'outils limités.

Le système remplace des dizaines d'outils généraux par des interfaces ciblées, telles qu'un navigateur web uniquement texte et une application de contrôle informatique, chacune maintenant un état persistant.
Cette approche empêche les petits modèles de faire des erreurs dans le texte exact comme les URL en utilisant une navigation simple verbe-numéro à l'intérieur du périmètre confiné.
Les tests sur Gemma 4 E4B ont montré de meilleures performances que Gemma 4 26B dans cette configuration, car le modèle plus grand présentait une aversion pour les outils de planification dédiés.
L'agent conserve le contexte complet en quittant ces applications, lui permettant d'accéder à un ensemble plus large d'environ 100 outils en mode général.

L'auteur suggère que cette architecture aide les petits modèles à gérer des tâches complexes en réduisant le bruit de contexte et la surcharge d'outils.