media Hugging Face Forums · منذ 10 يوم · open_models

NOVA-VAD يتفوق على Silero وPyannote وWebRTC في الصوت الضاخم بدقة 93%

مُترجم من English → العربية

يحقق NOVA-VAD، وهو كاشف نشاط صوتي خفيف الوزن وقابل للتفسير، دقة بنسبة 93% على الصوت الضاخم من مجموعة بيانات UrbanSound8K، متفوقًا على WebRTC (58%) وPyannote (62%) وSilero (87%). يستخدم فقط scikit-learn، ولا يتطلب GPU، ويوفر أهمية الميزات ودرجات الثقة باللغة الإنجليزية البسيطة.

الأهمية 1/3 الموثوقية 1/3 Hugging Face Forums Open weights Voice & audio

قراءة الأصل