За пределами среднего: трехосная точность для согласования симуляторов опросов на основе LLM по малым пилотным данным

В данном исследовании изучается, могут ли большие языковые модели восстанавливать статистические характеристики более широкой популяции, используя лишь небольшую пилотную выборку ответов людей. Авторы разлагают это восстановление на три оси: структурная точность, маргинальная точность и индивидуальная точность.

Исследование оценивает подходы к промптингу, коррекции и тонкой настройке на примере опроса о дезинформации по COVID-19.
Результаты показывают, что тонкая настройка на малых пилотных выборках обеспечивает сбалансированный подход для достижения нескольких форм точности.
Уровни точности, достигаемые при тонкой настройке, могут варьироваться в зависимости от подвыборок, что может угрожать плюралистическому согласованию.