Оценка направлений грамматического рода в контекстных эмбеддингах при контролируемых и естественных контекстах

Настоящее исследование решает проблему смешения грамматического рода и социального семантического смещения в контекстных языковых моделях для родовых языков, таких как испанский, предлагая фреймворк для разделения этих измерений. Авторы создают сбалансированные наборы данных с использованием контролируемых шаблонов и естественных контекстов из Википедии для оценки направлений рода при подавлении загрязнения.

Разработан фреймворк с оценщиками направлений рода на основе центроида, метода опорных векторов (SVM) и линейного дискриминантного анализа (LDA), а также стратегиями взвешивания, учитывающими загрязнение.
Введены метрики оценки с двойной целью для баланса между подавлением утечки грамматического рода на неодушевленных существительных и сохранением семантических различий рода для терминов профессий.
Результаты показывают, что неконтролируемые контролируемые контексты дают наиболее чистое направление грамматического рода, а оценщик центроида превосходит дискриминационные базовые модели.

Полученные результаты предоставляют метод изоляции грамматического рода от семантического смещения в контекстных эмбеддинках, открывая путь к более точному устранению гендерного смещения за пределами статических словесных эмбеддингов.