InterAligner introduce un objetivo de alineador intermedio y la pérdida InterCTC para permitir la formación de alineación progresiva en modelos profundos de ASR. En LibriSpeech con un Conformer de 17 capas, reduce el WER de 5.0/7.8 a 3.1/5.6, con mejoras significativas en utterances largas.
InterAligner: Alineación progresiva para ASR
Traducido del English → Español