Perturbación de prompts para una evaluación fiable de LLM

Un nuevo marco utiliza la perturbación de prompts para identificar y filtrar comparaciones por pares estructuralmente inconsistentes en evaluaciones de modelos de lenguaje grandes. Al incorporar verificaciones de consistencia a nivel de grafo antes de la agregación de clasificaciones, el método reduce las preferencias cíclicas y mejora la fiabilidad de las clasificaciones de LLM.