STAITUS: Desacoplar Apariencia y Pose para Seguimiento de Objetos en Vídeo
El artículo presenta STAITUS, un marco unificado para el seguimiento no supervisado de objetos en vídeo que aborda las limitaciones de las representaciones basadas en slots existentes al desacoplar explícitamente la apariencia de la pose geométrica. Al aplicar la alineación temporal únicamente en el espacio de apariencia y forzando la separación espacial dentro de los fotogramas, el método evita que los slots se fijen en fondos estáticos durante el movimiento.