Speech Playground: 음성 분석 및 비교를 위한 상호작용 도구

본 논문은 기존 Praat과 같은 도구를 최신 딥러닝 표현과 통합하는 어려움을 해결하도록 설계된 상호작용식 음성 시각화 및 비교 도구인 Speech Playground를 제시합니다.

이 시스템은 Python 백엔드와 웹 기반 프론트엔드를 결합하여 연속적, 이산적, 가변 길이 표현을 포함한 여러 특징 유형의 상호작용 탐색을 가능하게 합니다. 텍스트 그리드(TextGrid)와 강제 정렬(forced alignment) 지원을 제공하며, 시각적 및 청각적 비교를 위한 구성 가능한 거리 및 정렬 설정을 포함합니다.

Speech Playground는 음성 연구, 표현 검증, 발음 훈련 지원(CAPT) 중심 실험을 위해 사용되도록 의도되었습니다.