SGCD introduce un marco iterativo para mejorar los agentes GUI abordando las brechas de supervisión en estados fuera de trayectoria. Extrae habilidades tanto de rollouts exitosos como fallidos, utilizándolas para guiar continuaciones de políticas que se mezclan con trayectorias expertas. En OSWorld-Verified, SGCD aumenta las tasas de éxito de tres modelos base desde el 30% bajo hasta más del 50%.