एक उपयोगकर्ता एक ब्राउज़र-आधारित एजेंट आर्किटेक्चर साझा करता है जो सीमित टूलसेट वाले समर्पित "अनुप्रयोगों" या कार्यप्रवाह तक उनकी दृष्टि को सीमित करके छोटे स्थानीय भाषा मॉडलों के प्रदर्शन में सुधार करता है।

  • सिस्टम सैकड़ों सामान्य टूलस को फोकस्ड इंटरफेसेस से बदल देता है, जैसे कि केवल-पाठ वेब ब्राउज़र और कंप्यूटर कंट्रोल ऐप, प्रत्येक स्थिर अवस्था बनाए रखते हुए।
  • यह दृष्टिकोण सीमित स्कोप के भीतर सरल क्रिया-संख्या नेविगेशन का उपयोग करके छोटे मॉडलों को URL जैसे सटीक पाठ में त्रुटियों से रोकता है।
  • इस सेटअप पर Gemma 4 E4B पर टेस्ट ने Gemma 4 26B की तुलना में बेहतर प्रदर्शन दिखाया, क्योंकि बड़ा मॉडल समर्पित प्लानिंग टूल के प्रति असहजता दर्शाता है।
  • एजेंट इन अनुप्रयोगों से बाहर निकलते समय पूर्ण संदर्भ बनाए रखता है, जिससे उसे सामान्य मोड में ~100 टूलस के व्यापक सेट तक पहुंच मिलती है।

लेखक सुझाव देते हैं कि यह आर्किटेक्चर संदर्भ शोर और टूल ओवरलोड को कम करके छोटे मॉडलों को जटिल कार्यों को प्रबंधित करने में मदद करता है।