Un análisis psicométrico formal muestra que los aparentes perfiles psicológicos de los modelos de lenguaje grandes están impulsados principalmente por el sesgo de respuesta, no por rasgos reales. Este sesgo, que cambia con la capacidad del modelo y se amplifica por el diseño del instrumento, explica el 81-90% de la variación entre modelos, superando ampliamente las diferencias de rasgos humanos. El estudio concluye que estos perfiles son artefactos de medición y no propiedades del modelo, instando al desarrollo de evaluaciones basadas en la ortogonalidad de la respuesta.
Los perfiles psicológicos de los LLM son artefactos de medición
Traducido del English → Español