Un estudio evalúa características MFCC impulsadas por voz y un modelo HMM-DNN con mecanismos de atención para la discriminación de dialectos chinos. El enfoque combina incrustaciones a nivel de palabra y características MFCC utilizando una CNN, logrando un rendimiento superior en corpus de referencia de dialectos en comparación con los métodos existentes.