يقدم المؤلفون LuxEmo، وهو مجموعة بيانات كلام تعبيرية محادثة مدتها 21 ساعة للغة اللوكسمبورجية ذات الموارد المحدودة، وتتميز بأربع فئات عاطفية.
- اشتُقّت المجموعة من بثّات الشباب التابعة لراديو وتلفزيون لوكسمبورغ (RTL).
- تستخدم عملية التجميع سير عمل شبه تلقائي يتضمن كشف نشاط الصوت، إزالة الضوضاء، تحديد اللغة، التقسيم القائم على LuxASR، والتنبؤ العاطفي التلقائي.
- تم إجراء تقييم قياسي لأنظمة TTS التعبيرية الخمسة، والتي تغطي النقل عبر اللغات المستند إلى الألمانية، والدعم متعدد اللغات، والتكيّف، ونقل النبرة اللابارامتري.
تعالج هذه الدراسة نقص تمثيل اللغة اللوكسمبورجية في أبحاث تكنولوجيا الكلام من خلال توفير مجموعة بيانات مُثبتة لتطوير تحويل النص إلى كلام التعبيري.