В данном исследовании переоценивается использование переписывания входных данных для улучшения замороженных моделей нижнего уровня при разборе дискурса диалогов в условиях реальной эксплуатации, где отсутствует обучение уточнению. Авторы обнаруживают, что уточнение на основе последнего реплики гораздо менее надежно, чем предполагается в контролируемых настройках, поскольку переписывание, не зависящее от парсера, часто вызывает больше регрессий, чем исправлений.
- Анализ трех наборов данных SDRT (Segmented Discourse Representation Theory) и нескольких парсеров показывает, что правки, позволяющие исправить ошибки, часто нарушают дискурсивные признаки, на которые опирается парсер.
- Анализ «лучший из 8» вариантов переписывания демонстрирует практический предел: значительная часть ошибок не может быть исправлена только путем переписывания входных данных.
- Тренированный с помощью GRPO уточняющий модуль, учитывающий структуру парсера, снижает регрессии до 37% за счет обучения консервативному воздержанию от действий, однако все еще не способен создавать уточнения, учитывающие избирательность и стабильно улучшающие разбор.
Результаты переосмысливают задачу уточнения как проблему селективного вмешательства и выделяют предсказание возможности переписывания как ключевую недостающую способность для оптимизации на стороне входных данных замороженных дискурсивных парсеров.