Саймон Уиллисон делится советами из Fireside Chat с командой Claude Code для оптимизации использования токенов путем предоставления моделям, таким как Fable и Opus, возможности принимать собственные решения, а не следовать жестким инструкциям.
- Вместо того чтобы диктовать правила тестирования, пользователи должны поручить Fable решать, когда писать тесты, основываясь на собственной оценке.
- Чтобы сэкономить токены до повышения цен, запрашивайте у модели использование менее мощных моделей для небольших задач через субагентов.
- Был создан специальный файл памяти для делегирования задач по кодированию субагентам, используя Sonnet для основной реализации и Haiku для тривиальных правок.
Этот подход помогает сохранять лимит Fable, сохраняя эффективность за счет резервирования модели высшего уровня для задач, требующих суждения, таких как обзор и синтез.