Эмпирический анализ фактических ошибок в текстах, написанных человеком, и его применение
В данном исследовании рассматривается проблема игнорирования обнаружения фактических ошибок в текстах, написанных человеком, путем выделения таксономии ошибок из исправлений в газетных статьях. Выявлены категории, такие как неверное использование кандзи, отсутствующие в текущих бенчмарках галлюцинаций. Авторы оценивают базовые большие языковые модели на синтезированных тестовых случаях и реальных исправлениях для оценки их производительности в этой конкретной задаче.