В статье представлен FairBED — фреймворк, который изменяет сам процесс сбора данных, чтобы получать изначально более справедливые данные, устраняя предвзятость, присутствующую в существующих наборах данных. Он предлагает новые формулировки для количественной оценки справедливости наборов данных на основе принципа, согласно которому справедливые наборы данных не должны содержать информации о чувствительных атрибутах.

  • FairBED формирует практически применимые цели байесовского экспериментального дизайна, учитывающие справедливость, которые максимизируют ожидаемый прирост информации о целевой величине, одновременно минимизируя его для чувствительных атрибутов.
  • Авторы выводят теоретическую связь между FairBED и демографической паритетностью.
  • Эмпирические результаты показывают, что модели, обученные на данных, собранных с помощью FairBED, обеспечивают лучший компромисс между справедливостью и точностью по сравнению со случайно собранными данными и традиционным BED.

Этот подход помогает пользователям получать данные, более подходящие для обучения справедливых предикторов, за счет активного снижения предвзятости на этапе сбора, а не только её исправления в модели.