GLM 5.2 sugiere proactivamente la compresión de contexto durante una sesión de Claude Code

Un usuario observó que el modelo GLM 5.2, ejecutándose dentro de una sesión de Claude Code, detectó que su propio uso del contexto se acercaba a los límites y preguntó al usuario si continuar o hacer un punto de control.

El modelo identificó que la sesión había durado mucho y el contexto estaba pesando en 537k/1M tokens.
Ofreció dos opciones: continuar en la sesión actual mientras el contexto lo permita, o hacer un punto de control ahora y comenzar una nueva sesión para las tareas restantes.
Este comportamiento difiere de la compresión automática estándar, ya que el modelo inició explícitamente la discusión sobre la gestión del contexto.