एक अध्ययन जांचता है कि संदर्भित एम्बेडिंग्स (CEs) स्वतः उच्चारण भाषा समूह से निकाले गए 7470 मंडारिन एकवर्णीय CV शब्दों के लिए बोले गए शब्द की अवधि का पूर्वानुमान लगा सकते हैं या नहीं। परिणाम दिखाते हैं कि CEs प्रकार स्तर और व्यक्तिगत टोकन दोनों पर संयोग स्तर से ऊपर अवधि के लिए पूर्वानुमानित हैं।
- पूर्वानुमित अवधियाँ इतनी सटीक हैं कि सामान्यीकृत समय से मिलीसेकंड पैमाने पर f0 आरेखों को पीछे की ओर परिवर्तित किया जा सके।
- परिणामी पूर्वानुमित आरेख प्रायोगिक आरेखों के अनुमान लगते हैं और क्रमपरिवर्तन आधार रेखाओं से बेहतर प्रदर्शन करते हैं।
यह पुष्टि करता है कि CEs में भाषा के कालिक पहलुओं को मॉडल करने के लिए पर्याप्त जानकारी होती है, जिससे स्वर लय का अधिक सटीक संश्लेषण संभव होता है।