Um usuário observou que o modelo GLM 5.2, executando dentro de uma sessão do Claude Code, detectou que seu próprio uso de contexto estava se aproximando dos limites e perguntou ao usuário se deveria continuar ou fazer um checkpoint.

  • O modelo identificou que a sessão havia durado muito e o contexto estava ficando pesado em 537k/1M tokens.
  • Ele ofereceu duas opções: continuar na sessão atual enquanto o contexto permitir, ou fazer um checkpoint agora e iniciar uma nova sessão para as tarefas restantes.
  • Esse comportamento difere da compactação automática padrão, pois o modelo iniciou explicitamente a discussão sobre o gerenciamento de contexto.