저자들은 저자원 언어인 룩셈부르크어를 위한 21시간 분량의 대화형 표현 음성 코퍼스인 LuxEmo를 소개합니다. 이 코퍼스에는 네 가지 감정 카테고리가 포함되어 있습니다.
- 데이터셋은 Radio Télévision Luxembourg (RTL)의 청소년 방송에서 파생되었습니다.
- 큐레이션에는 음성 활동 감지, 노이즈 제거, 언어 식별, LuxASR 기반 분할 및 자동 감정 예측이 포함된 반자동 워크플로우가 사용됩니다.
- 독일어 기반 교차 언어 이전, 다국어 지원, 적응 및 비모수적 운율 이전을 아우르는 다섯 가지 표현 TTS 시스템이 벤치마킹되었습니다.
이 작업은 검증된 데이터셋을 제공함으로써 음성 기술 연구에서 룩셈부르크어의 과소 대표 문제를 해결합니다.