軽量で説明可能な音声活動検出器であるNOVA-VADは、UrbanSound8Kデータセットのノイズのある音声で93%の精度を達成し、WebRTC(58%)、Pyannote(62%)、Silero(87%)を上回ります。scikit-learnのみを使用し、GPUは不要で、特徴量の重要度と信頼スコアを平易な英語で提供します。
NOVA-VAD、ノイズのある音声で93%の精度によりSilero、Pyannote、WebRTCを上回る
翻訳元 English → 日本語
軽量で説明可能な音声活動検出器であるNOVA-VADは、UrbanSound8Kデータセットのノイズのある音声で93%の精度を達成し、WebRTC(58%)、Pyannote(62%)、Silero(87%)を上回ります。scikit-learnのみを使用し、GPUは不要で、特徴量の重要度と信頼スコアを平易な英語で提供します。