Пайплайны аудио-символьного распознавания расширяют ресурсы текстов для малоиспользуемых западноафриканских языков Фонгбе и Хауса. Тонкая настройка модели MMS-300M на языке Фонгбе достигает 9,48% WER с сохранением тонов, в то время как транскрипции на языке Хауса достигают 57,4/100 по оценке человека; оценка сегментов на языке Фонгбе составляет только 36,5/100, что указывает на необходимость постобработки или улучшения моделей. В исследовании выпущены отобранные данные, настроенные модели и транскрибированные корпусы в соответствии с этическими принципами.