La augmentación de datos mejora el aprendizaje de representaciones de proteínas, pero a menudo interrumpe la integridad estructural o reduce la diversidad. Los autores identifican estos defectos estructurales y problemas de degradación del rendimiento en los métodos existentes. Proponen Manifold Restore Mixing (MRM) para restaurar la información estructural perdida mientras introducen variaciones diversas. MRM mezcla las representaciones ocultas de los datos originales y aumentados, inspirado en las técnicas de manifold mixup. Un programador de dificultad de muestra ajusta la distribución beta para proporcionar muestras progresivamente más desafiantes durante el entrenamiento. Los experimentos en varias arquitecturas base y tareas posteriores demuestran la efectividad y generalización del método. La implementación está disponible en https://github.com/KingGugu/MRM.