Sabores casi-humanos: el omnivorismo estilizado de los sustitutos de encuestas de LLM

Este estudio evalúa la capacidad de los modelos de lenguaje grandes para aproximar los gustos culturales humanos generando sustitutos de silicio a partir de la Encuesta de Participación Pública en las Artes. Utilizando modelos de OpenAI, Anthropic y DeepSeek, los autores analizan 277.470 encuestados sintéticos para determinar si los LLM pueden replicar fielmente los datos de encuestas del mundo real.

Las muestras de silicio exhiben un sesgo positivo sistemático hacia el gusto, lo que lleva a estimaciones ecológicas infladas de los gustos que no están explicadas por el sesgo WEIRD.
La compleja relacionalidad encontrada en las estructuras reales de los gustos se pierde completamente dentro de las muestras de silicio.
Los alineamientos culturales conocidos entre los gustos y el espacio social se preservan pobremente, con asociaciones edad-gusto atenuadas y asociaciones clase-gusto resucitadas anacrónicamente.
Las asociaciones género-gusto y raza-gusto son caricaturizadas en lugar de representadas con precisión en los datos sintéticos.

Los hallazgos indican que los paneles de encuestas generados por LLM producen facsímiles altamente estilizados de los gustos humanos, planteando preocupaciones sobre su validez para aplicaciones de investigación de mercado y ciencias sociales.