arxiv arXiv cs.CL · hace 2 h · fuente: hace 9 d · research

Evaluación ligera de la pronunciación mediante la sorpresa de tokens de habla discretos

Traducido del English → Español

Un nuevo marco evalúa la pronunciación utilizando únicamente datos de habla nativa, sin errores etiquetados. Utiliza la sorpresa de los tokens de habla y la alineación guiada por transcripción para detectar desviaciones fonotácticas, logrando un rendimiento cercano al de los métodos supervisados en múltiples conjuntos de datos.

Importancia 1/3 arXiv cs.CL Evaluation & benchmarks Reasoning models Voice & audio

Leer original