Улучшение крупномасштабного слабо контролируемого распознавания речи путем фильтрации и отбора
Авторы предлагают новый подход к обучению сквозных систем автоматического распознавания речи (ASR), который решает проблемы зашумленных меток и отсутствия специфичности для домена в крупномасштабных слабо контролируемых наборах данных. Метод включает предварительное обучение на полном наборе данных, продолжение предварительного обучения на отфильтрованном подмножестве на основе ошибки распознавания по символам (CER) и тонкую настройку на акустически близких образцах из этого подмножества.