LuxEmo: Korpus TTS ekspresif bahasa Luksemburg selama 21 jam

Para penulis memperkenalkan LuxEmo, sebuah korpus suara ekspresif konversional selama 21 jam untuk bahasa dengan sumber daya rendah Luxembourgish, yang mencakup empat kategori emosi.

Dataset ini berasal dari siaran pemuda Radio Télévision Luxembourg (RTL).
Kurasi menggunakan alur kerja semi-otomatis dengan deteksi aktivitas suara, denoising, identifikasi bahasa, segmentasi berbasis LuxASR, dan prediksi emosi otomatis.
Lima sistem TTS ekspresif diuji benchmark, mencakup transfer lintas-bahasa berbasis Jerman, dukungan multibahasa, adaptasi, dan transfer prosodi non-parametrik.

Karya ini mengatasi kurangnya representasi bahasa Luxembourgish dalam penelitian teknologi suara dengan menyediakan dataset yang tervalidasi untuk pengembangan text-to-speech ekspresif.