PASQA: Modelo de Calidad de Voz Enfocado en el Acento Tonal

PASQA es un modelo de evaluación de calidad de voz diseñado para evaluar la corrección del acento tonal en el habla japonesa sintética. Utiliza un conjunto de datos con errores de acento controlados e incorpora aprendizaje autosupervisado, fusión condicionada por mora, pérdida de clasificación y localización de errores de acento para lograr alta precisión en la detección de errores de acento entre hablantes, superando a los modelos convencionales en alineación con los juicios humanos.