Simon Willison compartilha dicas de um bate-papo ao lado da lareira com a equipe do Claude Code para otimizar o uso de tokens, permitindo que modelos como Fable e Opus exerçam seu próprio julgamento em vez de seguir instruções rígidas.
- Em vez de ditar regras de teste, os usuários devem instruir o Fable a decidir quando escrever testes com base em sua própria avaliação.
- Para conservar tokens antes dos aumentos de preço, solicite ao modelo que use modelos de menor potência para tarefas menores por meio de subagentes.
- Um arquivo de memória específico foi criado para delegar tarefas de codificação a subagentes, usando o Sonnet para implementação substantiva e o Haiku para edições triviais.
Essa abordagem ajuda a preservar a cota do Fable enquanto mantém a eficiência, reservando o modelo de topo para tarefas que exigem julgamento, como revisão e síntese.