El artículo presenta FairBED, un marco que modifica el propio proceso de adquisición de datos para recopilar datos inherentemente más justos, abordando los sesgos presentes en los conjuntos de datos existentes. Proporciona formulaciones novedosas para cuantificar la equidad del conjunto de datos basadas en el principio de que los conjuntos de datos justos no deben ser informativos sobre los atributos sensibles.

  • FairBED construye objetivos prácticos de diseño experimental bayesiano conscientes de la equidad que maximizan la ganancia de información esperada sobre la cantidad objetivo mientras la minimizan para los atributos sensibles.
  • Los autores derivan un vínculo teórico entre FairBED y la paridad demográfica.
  • Los resultados empíricos muestran que los modelos entrenados con datos recopilados mediante FairBED proporcionan mejores compromisos entre equidad y precisión en comparación con los datos adquiridos aleatoriamente y el BED convencional.

Este enfoque ayuda a los usuarios a obtener datos más adecuados para entrenar predictores justos al reducir activamente el sesgo durante la fase de recopilación en lugar de solo corregirlo en el modelo.