上下文嵌入可预测普通话单词的持续时间和音高

一项研究调查了上下文嵌入（CEs）能否预测从自发语音语料库中提取的7470个普通话单音节CV词的口语单词持续时间。结果表明，CEs在类型层面和单个词元层面均能显著预测持续时间，其预测能力高于随机水平。

这证实了CEs包含足够的信息来建模语音的时间方面，从而实现更准确的韵律合成。