Авторы представляют LuxEmo, 21-часовой корпус разговорной выразительной речи для малоресурсного языка люксембургский, включающий четыре категории эмоций.

  • Набор данных получен из молодежных передач Radio Télévision Luxembourg (RTL).
  • Курирование использует полуавтоматический рабочий процесс с обнаружением активности голоса, шумоподавлением, идентификацией языка, сегментацией на основе LuxASR и автоматическим предсказанием эмоций.
  • Протестированы пять систем выразительного синтеза речи (TTS), охватывающих кроссоязыковую передачу на основе немецкого, многоязычную поддержку, адаптацию и непараметрическую передачу просодии.

Работа решает проблему недостаточной представленности люксембургского языка в исследованиях технологий речи, предоставляя проверенный набор данных для разработки выразительного синтеза текста в речь.