Аугментация данных: взгляд с точки зрения анализа Фурье

В данной статье исследуется, может ли частичная аугментация данных обеспечить те же статистические преимущества, что и полная аугментация, путем разработки_framework_ на основе анализа Фурье и теории представлений конечных групп.

Частичная аугментация данных, основанная на случайно выбранном подмножестве элементов группы, достигает тех же минимаксных скоростей сходимости, что и полная аугментация, с точностью до ошибки аппроксимации, которая стремится к нулю по мере увеличения размера подмножества.
В работе доказан результат о невозможности: обеспечение точной инвариантности требует усреднения по всей группе и не может быть достигнуто никаким строгим подмножеством, когда пространство гипотез достаточно выразительно.
Эти выводы дают теоретическое объяснение того, почему частичная аугментация сохраняет статистические преимущества, несмотря на то, что симметрия обеспечивается лишь приблизительно.

Полученные результаты предлагают унифицированную перспективу для полной и частичной аугментации данных, отвечая на вопрос о том, можно ли достичь статистически оптимального обучения при общих групповых инвариантностях с помощью вычислительно масштабируемых методов.