作者介绍了 LuxEmo,这是一个针对低资源语言卢森堡语的 21 小时对话式表达性语音语料库,包含四种情感类别。

  • 该数据集源自 Radio Télévision Luxembourg (RTL) 的青少年广播节目。
  • 数据整理采用半自动工作流,包括语音活动检测、去噪、语言识别、基于 LuxASR 的分段以及自动情感预测。
  • 对五个表达性 TTS 系统进行了基准测试,涵盖基于德语的跨语言迁移、多语言支持、适配和非参数韵律迁移。

这项工作通过提供经过验证的数据集,解决了卢森堡语在语音技术研究中的代表性不足问题,促进了表达性文本转语音的发展。