NOVA-VAD, un détecteur d'activité vocale léger et explicable, atteint une précision de 93 % sur l'audio bruyant du jeu de données UrbanSound8K, surpassant WebRTC (58 %), Pyannote (62 %) et Silero (87 %). Il utilise uniquement scikit-learn, ne nécessite pas de GPU et fournit l'importance des fonctionnalités et les scores de confiance en anglais simple.
NOVA-VAD bat Silero, Pyannote et WebRTC sur l'audio bruyant avec une précision de 93 %
Traduit de English → Français