Un usuario comparte una arquitectura de agente basada en navegador que mejora el rendimiento de modelos de lenguaje locales más pequeños al restringir su vista a "aplicaciones" o flujos de trabajo dedicados con conjuntos de herramientas limitados.
- El sistema redecena docenas de herramientas generales por interfaces enfocadas, como un navegador web solo de texto y una aplicación de control del ordenador, cada una manteniendo un estado persistente.
- Este enfoque evita que los modelos más pequeños cometan errores en texto exacto como URLs mediante una navegación simple de verbo-número dentro del alcance confinado.
- Las pruebas en Gemma 4 E4B mostraron un mejor rendimiento que Gemma 4 26B bajo esta configuración, ya que el modelo más grande exhibió aversión a las herramientas de planificación dedicadas.
- El agente retiene el contexto completo al salir de estas aplicaciones, permitiéndole acceder a un conjunto más amplio de ~100 herramientas en un modo general.
El autor sugiere que esta arquitectura ayuda a los modelos más pequeños a gestionar tareas complejas reduciendo el ruido del contexto y la sobrecarga de herramientas.