Simon Willison partage des conseils tirés d'une discussion avec l'équipe de Claude Code pour optimiser l'utilisation des jetons en permettant à des modèles comme Fable et Opus d'exercer leur propre jugement plutôt que de suivre des instructions rigides.

  • Au lieu de dicter des règles de test, les utilisateurs devraient demander à Fable de décider quand écrire des tests en fonction de son propre évaluation.
  • Pour économiser des jetons avant les augmentations de prix, invitez le modèle à utiliser des modèles moins puissants pour les petites tâches via des sous-agents.
  • Un fichier mémoire spécifique a été créé pour déléguer les tâches de codage aux sous-agents en utilisant Sonnet pour l'implémentation substantielle et Haiku pour les modifications triviales.

Cette approche aide à préserver le quota de Fable tout en maintenant l'efficacité en réservant le modèle de haut niveau pour des tâches nécessitant un jugement, comme la révision et la synthèse.