경량이고 설명 가능한 음성 활동 감지기인 NOVA-VAD는 UrbanSound8K 데이터세트의 노이즈 있는 오디오에서 93%의 정확도를 달성하여 WebRTC(58%), Pyannote(62%), Silero(87%)를 능가합니다. scikit-learn만 사용하며 GPU가 필요 없고, 평이한 영어로 기능 중요도와 신뢰 점수를 제공합니다.
NOVA-VAD, 노이즈 있는 오디오에서 93% 정확도로 Silero, Pyannote, WebRTC를 압도
번역 English → 한국어