लेखकों ने LuxEmo पेश किया है, जो कम संसाधन वाले लक्जमबर्गी भाषा के लिए 21-घंटे की संवादात्मक अभिव्यक्तिपूर्ण वार्तालाप कोरपस है, जिसमें चार भावना श्रेणियाँ हैं।

  • डेटासेट Radio Télévision Luxembourg (RTL) के युवा प्रसारणों से व्युत्पन्न है।
  • संपादन में आवाज गतिविधि पता लगाने, शोर हटाने, भाषा पहचान, LuxASR-आधारित खंडीकरण और स्वचालित भावना पूर्वानुमान के साथ एक अर्ध-स्वचालित कार्यप्रवाह का उपयोग किया जाता है।
  • चार अभिव्यक्तिपूर्ण TTS प्रणालियों का बेंचमार्किंग किया गया, जिसमें जर्मन-आधारित क्रॉस-लिंगुअल ट्रांसफर, बहुभाषी समर्थन, अनुकूलन और गैर-पैरामीट्रिक प्रोसोडी ट्रांसफर शामिल हैं।

यह कार्य अभिव्यक्तिपूर्ण टेक्स्ट-टू-स्पीच विकास के लिए एक मान्यता प्राप्त डेटासेट प्रदान करके वार्तालाप प्रौद्योगिकी अनुसंधान में लक्जमबर्गी भाषा की अपर्याप्त प्रतिनिधित्व समस्या को हल करता है।