Seorang pengguna membagikan arsitektur agen berbasis browser yang meningkatkan kinerja model bahasa lokal yang lebih kecil dengan membatasi pandangannya ke "aplikasi" atau alur kerja khusus dengan set alat terbatas.

  • Sistem ini menggantikan puluhan alat umum dengan antarmuka yang fokus, seperti browser web hanya teks dan aplikasi kontrol komputer, masing-masing mempertahankan keadaan persisten.
  • Pendekatan ini mencegah model yang lebih kecil membuat kesalahan dalam teks tepat seperti URL dengan menggunakan navigasi kata kerja-angka sederhana di dalam cakupan yang terbatas.
  • Uji coba pada Gemma 4 E4B menunjukkan kinerja yang lebih baik daripada Gemma 4 26B di bawah pengaturan ini, karena model yang lebih besar menunjukkan keengganan terhadap alat perencanaan khusus.
  • Agen mempertahankan konteks penuh saat meninggalkan aplikasi-aplikasi ini, memungkinkannya mengakses set alat yang lebih luas sekitar ~100 dalam mode umum.

Penulis menyarankan bahwa arsitektur ini membantu model yang lebih kecil mengelola tugas kompleks dengan mengurangi kebisingan konteks dan kelebihan beban alat.