NOVA-VAD是一种轻量级且可解释的语音活动检测器,在UrbanSound8K数据集的嘈杂音频上达到93%的准确率,优于WebRTC(58%)、Pyannote(62%)和Silero(87%)。它仅使用scikit-learn,无需GPU,并提供纯英文的特征重要性和置信度分数。