Sin preferencia propia en la revisión de modelos bajo autoría genuina

Una prueba con cuatro modelos en IFEval muestra que no hay una preferencia propia detectable en los grandes modelos de lenguaje al revisar su propio texto. Los autores rechazan ediciones verificadas como correctas a tasas comparables a las de modelos nuevos, con una diferencia de -5.1 puntos porcentuales (IC 95% [-12.9, +2.7]). Cuando los autores rechazan correcciones, el 97% de las razones se deben a la detección de defectos, no a preferencia.

Benchmarks