Un análisis empírico de errores factuales en textos escritos por humanos y su aplicación
Este estudio aborda la negligencia en la detección de errores factuales en textos escritos por humanos mediante la extracción de una taxonomía de errores a partir de correcciones de artículos periodísticos, revelando categorías como las malconversiones de kanji que están ausentes en los benchmarks actuales de alucinación. Los autores evalúan modelos de lenguaje grandes estándar en casos de prueba sintetizados y correcciones reales para evaluar su rendimiento en esta tarea específica.