Para penulis memperkenalkan LuxEmo, sebuah korpus suara ekspresif konversional selama 21 jam untuk bahasa dengan sumber daya rendah Luxembourgish, yang mencakup empat kategori emosi.

  • Dataset ini berasal dari siaran pemuda Radio Télévision Luxembourg (RTL).
  • Kurasi menggunakan alur kerja semi-otomatis dengan deteksi aktivitas suara, denoising, identifikasi bahasa, segmentasi berbasis LuxASR, dan prediksi emosi otomatis.
  • Lima sistem TTS ekspresif diuji benchmark, mencakup transfer lintas-bahasa berbasis Jerman, dukungan multibahasa, adaptasi, dan transfer prosodi non-parametrik.

Karya ini mengatasi kurangnya representasi bahasa Luxembourgish dalam penelitian teknologi suara dengan menyediakan dataset yang tervalidasi untuk pengembangan text-to-speech ekspresif.