В данном исследовании изучается, могут ли большие языковые модели восстанавливать статистические характеристики более широкой популяции, используя лишь небольшую пилотную выборку ответов людей. Авторы разлагают это восстановление на три оси: структурная точность, маргинальная точность и индивидуальная точность.
- Исследование оценивает подходы к промптингу, коррекции и тонкой настройке на примере опроса о дезинформации по COVID-19.
- Результаты показывают, что тонкая настройка на малых пилотных выборках обеспечивает сбалансированный подход для достижения нескольких форм точности.
- Уровни точности, достигаемые при тонкой настройке, могут варьироваться в зависимости от подвыборок, что может угрожать плюралистическому согласованию.