Las tuberías de ASR extienden los recursos textuales para las lenguas de África Occidental con pocos recursos, fongbe y hausa. El ajuste fino de MMS-300M en fongbe logra un WER del 9.48% con diacríticos tonales preservados, mientras que las transcripciones de hausa alcanzan una puntuación de evaluación humana de 57.4/100; los segmentos de fongbe obtienen solo 36.5/100, lo que indica la necesidad de postprocesamiento o modelos mejorados. El estudio libera conjuntos de datos curados, modelos ajustados finamente y corpus transcritos bajo pautas éticas.
Desarrollo de corpus textual basado en ASR para fongbe y hausa
Traducido del English → Español