Este artículo investiga si el aumento parcial de datos puede lograr los mismos beneficios estadísticos que el aumento completo, desarrollando un marco basado en el análisis de Fourier y la teoría de representaciones de grupos finitos.
- El aumento parcial de datos basado en un subconjunto muestreado aleatoriamente de elementos del grupo alcanza las mismas tasas minimax que el aumento completo, hasta un error de aproximación que desaparece a medida que aumenta el tamaño del subconjunto.
- El estudio demuestra un resultado de imposibilidad que establece que imponer invarianza exacta requiere promediar sobre todo el grupo y no puede lograrse mediante ningún subconjunto estricto cuando el espacio de hipótesis es suficientemente expresivo.
- Estos hallazgos proporcionan una explicación teórica de por qué el aumento parcial conserva los beneficios estadísticos a pesar de imponer la simetría solo de forma aproximada.
Los resultados ofrecen una perspectiva unificada sobre el aumento completo y parcial de datos, abordando si se puede lograr un aprendizaje estadísticamente óptimo bajo invarianzas generales de grupos utilizando métodos escalables computacionalmente.