Marco metodológico para evaluar el sesgo social en LLM

Un marco unificado estandariza las evaluaciones de benchmark para comparar configuraciones aisladas frente a comparativas en la detección de sesgos sociales. Los resultados muestran que las configuraciones comparativas amplifican la discriminación latente, especialmente con razonamiento Chain-of-Thought, y este sesgo persiste incluso con respuestas neutrales de respaldo. El efecto escala con el tamaño del modelo, lo que sugiere que los despliegues comparativos son inseguros en escenarios del mundo real ambiguos.