В данной статье исследуется, может ли частичная аугментация данных обеспечить те же статистические преимущества, что и полная аугментация, путем разработки_framework_ на основе анализа Фурье и теории представлений конечных групп.

  • Частичная аугментация данных, основанная на случайно выбранном подмножестве элементов группы, достигает тех же минимаксных скоростей сходимости, что и полная аугментация, с точностью до ошибки аппроксимации, которая стремится к нулю по мере увеличения размера подмножества.
  • В работе доказан результат о невозможности: обеспечение точной инвариантности требует усреднения по всей группе и не может быть достигнуто никаким строгим подмножеством, когда пространство гипотез достаточно выразительно.
  • Эти выводы дают теоретическое объяснение того, почему частичная аугментация сохраняет статистические преимущества, несмотря на то, что симметрия обеспечивается лишь приблизительно.

Полученные результаты предлагают унифицированную перспективу для полной и частичной аугментации данных, отвечая на вопрос о том, можно ли достичь статистически оптимального обучения при общих групповых инвариантностях с помощью вычислительно масштабируемых методов.