Permitindo que o Fable do Claude Code use seu próprio julgamento

Simon Willison compartilha dicas de um bate-papo ao lado da lareira com a equipe do Claude Code para otimizar o uso de tokens, permitindo que modelos como Fable e Opus exerçam seu próprio julgamento em vez de seguir instruções rígidas.

Em vez de ditar regras de teste, os usuários devem instruir o Fable a decidir quando escrever testes com base em sua própria avaliação.
Para conservar tokens antes dos aumentos de preço, solicite ao modelo que use modelos de menor potência para tarefas menores por meio de subagentes.
Um arquivo de memória específico foi criado para delegar tarefas de codificação a subagentes, usando o Sonnet para implementação substantiva e o Haiku para edições triviais.

Essa abordagem ajuda a preservar a cota do Fable enquanto mantém a eficiência, reservando o modelo de topo para tarefas que exigem julgamento, como revisão e síntese.