한 사용자가 브라우저 기반 에이전트 아키텍처를 공유하여, 제한된 도구 세트를 가진 전용 "애플리케이션" 또는 워크플로우로 모델의 시야를 제한함으로써 소규모 로컬 언어 모델의 성능을 향상시켰습니다.

  • 이 시스템은 텍스트 전용 웹 브라우저 및 컴퓨터 제어 앱 등 지속적 상태를 유지하는 집중형 인터페이스로 수십 개의 일반 도구를 대체합니다.
  • 이 접근 방식은 제한된 범위 내에서 간단한 동사-숫자 네비게이션을 사용함으로써 URL과 같은 정확한 텍스트에서 소규모 모델의 오류를 방지합니다.
  • Gemma 4 E4B 에 대한 테스트는 이 설정 하에서 Gemma 4 26B 보다 더 나은 성능을 보였는데, 이는 대규모 모델이 전용 계획 도구를 회피하는 경향이 있었기 때문입니다.
  • 에이전트는 이러한 애플리케이션을 떠날 때 전체 컨텍스트를 유지하여 일반 모드에서 약 100개의 더 넓은 도구 세트에 접근할 수 있습니다.

저자는 이 아키텍처가 컨텍스트 노이즈와 도구 과부하를 줄여 소규모 모델이 복잡한 작업을 관리하는 데 도움이 된다고 제안합니다.