Este estudio aborda la confusión entre el género gramatical y el sesgo semántico social en modelos de lenguaje contextuales para idiomas con género como el español, proponiendo un marco para desentrañar estas dimensiones. Los autores construyen conjuntos de datos equilibrados utilizando plantillas controladas y contextos naturales de Wikipedia para estimar las direcciones de género mientras suprimen la contaminación.

  • Se diseña un marco con estimadores de dirección de género basados en centroides, Máquinas de Vectores de Soporte (SVM) y Análisis Discriminante Lineal (LDA), junto con estrategias de ponderación conscientes de la contaminación.
  • Se introducen métricas de evaluación de doble objetivo para equilibrar la supresión de la fuga de género gramatical en sustantivos inanimados con la preservación de las distinciones semánticas de género para términos de ocupación.
  • Los resultados indican que los contextos controlados sin ponderación producen la dirección de género gramatical más pura, y el estimador de centroides supera a las líneas base discriminativas.

Los hallazgos proporcionan un método para aislar el género gramatical del sesgo semántico en incrustaciones contextuales, ofreciendo una vía para una desviación de género más precisa más allá de las incrustaciones estáticas de palabras.