Саймон Уиллисон делится советами из Fireside Chat с командой Claude Code для оптимизации использования токенов путем предоставления моделям, таким как Fable и Opus, возможности принимать собственные решения, а не следовать жестким инструкциям.

  • Вместо того чтобы диктовать правила тестирования, пользователи должны поручить Fable решать, когда писать тесты, основываясь на собственной оценке.
  • Чтобы сэкономить токены до повышения цен, запрашивайте у модели использование менее мощных моделей для небольших задач через субагентов.
  • Был создан специальный файл памяти для делегирования задач по кодированию субагентам, используя Sonnet для основной реализации и Haiku для тривиальных правок.

Этот подход помогает сохранять лимит Fable, сохраняя эффективность за счет резервирования модели высшего уровня для задач, требующих суждения, таких как обзор и синтез.