NOVA-VAD是一种轻量级且可解释的语音活动检测器,在UrbanSound8K数据集的嘈杂音频上达到93%的准确率,优于WebRTC(58%)、Pyannote(62%)和Silero(87%)。它仅使用scikit-learn,无需GPU,并提供纯英文的特征重要性和置信度分数。
NOVA-VAD在嘈杂音频上以93%的准确率击败Silero、Pyannote和WebRTC
译自 English → 中文
NOVA-VAD是一种轻量级且可解释的语音活动检测器,在UrbanSound8K数据集的嘈杂音频上达到93%的准确率,优于WebRTC(58%)、Pyannote(62%)和Silero(87%)。它仅使用scikit-learn,无需GPU,并提供纯英文的特征重要性和置信度分数。