media Hugging Face Forums · 8 hari lalu · open_models

Klasifikator Audio Wav2vec2 dan WavLM Macet di Akurasi 33%

Diterjemahkan dari English → Bahasa Indonesia

Seorang pengguna melaporkan bahwa fine-tuning wav2vec2-base atau wavlm-base-plus untuk klasifikasi audio 3 kelas hanya mencapai akurasi 33%, sesuai dengan tingkat kebetulan. Model dilatih hanya dengan memperbarui kepala klasifikasi, menggunakan klip yang diisi (padded) dengan durasi 1,0 detik tanpa mask perhatian, dan dengan learning rate 1e-3, yang menyebabkan kinerja buruk meskipun ada ketidakseimbangan kelas dan klip input yang pendek.

Kepentingan 1/3 Kepercayaan 1/3 Hugging Face Forums Code generation Evaluation & benchmarks

Baca aslinya