Авторы представляют LuxEmo, 21-часовой корпус разговорной выразительной речи для малоресурсного языка люксембургский, включающий четыре категории эмоций.
- Набор данных получен из молодежных передач Radio Télévision Luxembourg (RTL).
- Курирование использует полуавтоматический рабочий процесс с обнаружением активности голоса, шумоподавлением, идентификацией языка, сегментацией на основе LuxASR и автоматическим предсказанием эмоций.
- Протестированы пять систем выразительного синтеза речи (TTS), охватывающих кроссоязыковую передачу на основе немецкого, многоязычную поддержку, адаптацию и непараметрическую передачу просодии.
Работа решает проблему недостаточной представленности люксембургского языка в исследованиях технологий речи, предоставляя проверенный набор данных для разработки выразительного синтеза текста в речь.