Simon Willison은 Claude Code 팀과의 Fireside Chat에서 얻은 팁을 공유하며, Fable 및 Opus와 같은 모델이 엄격한 지침을 따르는 대신 자체 판단을 내릴 수 있도록 하여 토큰 사용을 최적화하는 방법을 설명합니다.

  • 테스트 규칙을 지시하는 대신 사용자는 Fable가 자신의 평가에 따라 테스트를 작성할 시기를 결정하도록 지시해야 합니다.
  • 가격 인상 전에 토큰을 절약하기 위해 하위 에이전트를 통해 작은 작업에는 저성능 모델을 사용하도록 프롬프트합니다.
  • 하위 에이전트에 코딩 작업을 위임하기 위한 특정 메모리 파일이 생성되었으며, 실질적인 구현에는 Sonnet, 사소한 편집에는 Haiku가 사용됩니다.

이 접근 방식은 리뷰 및 합성과 같은 판단이 중요한 작업에는 최상위 모델을 예약함으로써 Fable 할당량을 보존하면서도 효율성을 유지하는 데 도움이 됩니다.