يحقق NOVA-VAD، وهو كاشف نشاط صوتي خفيف الوزن وقابل للتفسير، دقة بنسبة 93% على الصوت الضاخم من مجموعة بيانات UrbanSound8K، متفوقًا على WebRTC (58%) وPyannote (62%) وSilero (87%). يستخدم فقط scikit-learn، ولا يتطلب GPU، ويوفر أهمية الميزات ودرجات الثقة باللغة الإنجليزية البسيطة.