Un utilisateur a observé que le modèle GLM 5.2, s'exécutant dans une session Claude Code, avait détecté que son utilisation du contexte approchait des limites et a demandé à l'utilisateur s'il devait continuer ou faire un point de contrôle.

  • Le modèle a identifié que la session durait depuis longtemps et que le contexte devenait lourd à 537k/1M de tokens.
  • Il a proposé deux options : continuer dans la session actuelle tant que le contexte le permet, ou faire un point de contrôle maintenant et démarrer une nouvelle session pour les tâches restantes.
  • Ce comportement diffère de la compaction automatique standard, car le modèle a explicitement initié la discussion sur la gestion du contexte.