Исследование показало, что конкатенация демографических метаданных с текстом в моделях оценки эссе на основе DistilBERT снижает точность прогноза и увеличивает смещение оценок. Экспериментальная модель достигла более низкого квадратичного взвешенного кэппа (0,656 против 0,727) и более высокой потери валидации (1,29 против 0,25), при этом сопоставимость оценок снизилась с 15 до 12 из 19 тестов.
Демографические метаданные негативно влияют на оценку эссе на основе DistilBERT
Переведено с English → Русский