Un usuario observó que el modelo GLM 5.2, ejecutándose dentro de una sesión de Claude Code, detectó que su propio uso del contexto se acercaba a los límites y preguntó al usuario si continuar o hacer un punto de control.
- El modelo identificó que la sesión había durado mucho y el contexto estaba pesando en 537k/1M tokens.
- Ofreció dos opciones: continuar en la sesión actual mientras el contexto lo permita, o hacer un punto de control ahora y comenzar una nueva sesión para las tareas restantes.
- Este comportamiento difiere de la compresión automática estándar, ya que el modelo inició explícitamente la discusión sobre la gestión del contexto.