Simon Willison comparte consejos de un Fireside Chat con el equipo de Claude Code para optimizar el uso de tokens permitiendo a modelos como Fable y Opus ejercer su propio juicio en lugar de seguir instrucciones rígidas.

  • En lugar de dictar reglas de prueba, los usuarios deben instruir a Fable para que decida cuándo escribir pruebas basándose en su propia evaluación.
  • Para conservar tokens antes de los aumentos de precios, se debe solicitar al modelo que use modelos de menor potencia para tareas más pequeñas mediante subagentes.
  • Se creó un archivo de memoria específico para delegar tareas de codificación a subagentes, utilizando Sonnet para la implementación sustantiva y Haiku para ediciones triviales.

Este enfoque ayuda a preservar el límite de Fable mientras mantiene la eficiencia al reservar el modelo de gama alta para tareas que requieren juicio, como la revisión y la síntesis.