Melampaui Klarifikasi Supervised: Penulisan Ulang Input dengan LLM untuk Parsing Wacana Dialog

Studi ini mengevaluasi ulang penggunaan penulisan ulang input untuk meningkatkan model downstream yang beku bagi parsing wacana dialog dalam kondisi penyebaran nyata di mana tidak ada supervisi klarifikasi yang tersedia. Penulis menemukan bahwa klarifikasi ucapan terakhir jauh lebih tidak andal daripada yang disarankan oleh pengaturan supervised, karena penulisan ulang yang agnostik terhadap parser sering kali memperkenalkan lebih banyak regresi daripada perbaikan.

Di tiga dataset Teori Representasi Wacana Tersegmentasi (SDRT) dan beberapa parser, analisis mengungkapkan bahwa suntingan yang memungkinkan perbaikan sering mengganggu isyarat wacana yang diandalkan oleh parser.
Analisis penulisan ulang terbaik dari 8 menunjukkan batas praktis di mana sebagian besar kesalahan tidak dapat diperbaiki hanya melalui penulisan ulang input.
Klarifier yang sadar parser dan dilatih dengan GRPO mengurangi regresi hingga 37% dengan mempelajari abstensi konservatif, namun tetap gagal menghasilkan klarifikasi yang sadar selektivitas yang secara konsisten meningkatkan parsing.

Temuan ini menggambarkan ulang klarifikasi sebagai masalah intervensi selektif dan mengidentifikasi prediksi rewritability sebagai kemampuan kunci yang hilang untuk optimisasi sisi input parser wacana yang beku.