NOVA-VAD, एक हल्का और व्याख्या योग्य वॉयस एक्टिविटी डिटेक्टर, UrbanSound8K डेटासेट से शोर भरे ऑडियो पर 93% सटीकता प्राप्त करता है, जो WebRTC (58%), Pyannote (62%) और Silero (87%) को पीछे छोड़ता है। यह केवल scikit-learn का उपयोग करता है, GPU की आवश्यकता नहीं होती है, और साधारण अंग्रेजी में फीचर महत्व और आत्मविश्वास स्कोर प्रदान करता है।
शोर भरे ऑडियो पर NOVA-VAD ने 93% सटीकता के साथ Silero, Pyannote और WebRTC को हराया
अनुवादित English → हिन्दी