Simon Willisonは、Claude CodeチームとのFireside Chatから得たヒントを共有し、FableやOpusのようなモデルが厳格な指示に従うのではなく、独自の判断を下すことでトークン使用量を最適化する方法について説明しています。
- テストルールを指示するのではなく、ユーザーはFableにテストを書くべきかどうかを自身の評価に基づいて決定するよう指示すべきです。
- 価格上昇前にトークンを節約するために、サブエージェントを通じて小さなタスクには低性能なモデルを使用するようプロンプトします。
- コーディングタスクをサブエージェントに委任するための特定のメモリファイルが作成され、実質的な実装にはSonnet、些細な編集にはHaikuが使用されます。
このアプローチにより、判断力が重要なレビューや統合などのタスクには最上位モデルを予約し、Fableの割り当てを維持しながら効率性を保つことができます。