Un análisis psicométrico formal muestra que los aparentes perfiles psicológicos de los modelos de lenguaje grandes están impulsados principalmente por el sesgo de respuesta, no por rasgos reales. Este sesgo, que hace que los modelos favorezcan consistentemente un extremo de una escala, explica del 81% al 90% de la variación entre modelos, superando ampliamente las diferencias humanas. El estudio concluye que estos perfiles son artefactos del diseño del instrumento y no propiedades verdaderas del modelo, instando al desarrollo de evaluaciones basadas en la ortogonalidad de la respuesta.
Los perfiles psicológicos de los LLM son artefactos de medición
Traducido del English → Español