一位用户分享了一种基于浏览器的代理架构,该架构通过将其视图限制为具有有限工具集的专用“应用程序”或工作流,提高了较小本地语言模型的性能。

  • 该系统用专注的界面取代了数十种通用工具,例如纯文本网页浏览器和计算机控制应用,每个都保持持久状态。
  • 这种方法通过在受限范围内进行简单的动词-数字导航,防止较小模型在精确文本(如URL)中出错。
  • 在该设置下对 Gemma 4 E4B 的测试显示其性能优于 Gemma 4 26B,因为较大的模型表现出对专用规划工具的排斥。
  • 代理在离开这些应用程序时保留完整上下文,使其能够在通用模式下访问更广泛的约100种工具。

作者建议这种架构通过减少上下文噪声和工具过载,帮助较小模型管理复杂任务。