Изменение ширины сегментации и размера кластера в моделях генеративного речевого языка позволяет обеспечивать понятную и естественную синтез речи при более низких битрейтах по сравнению с базовым вариантом. Качество продолжения речи остается стабильным при этих более низких битрейтах по нескольким метрикам, что указывает на то, что традиционные настройки могут быть необязательными. Метрики, основанные на больших языковых моделях, коррелируют лучше с оценками людей, но все еще показывают низкую согласованность, что подчеркивает необходимость улучшения автоматической оценки.
Ширина сегментации и размер кластера влияют на резинсис речи в моделях генеративного речевого языка
Переведено с English → Русский