एक अध्ययन जांचता है कि संदर्भित एम्बेडिंग्स (CEs) स्वतः उच्चारण भाषा समूह से निकाले गए 7470 मंडारिन एकवर्णीय CV शब्दों के लिए बोले गए शब्द की अवधि का पूर्वानुमान लगा सकते हैं या नहीं। परिणाम दिखाते हैं कि CEs प्रकार स्तर और व्यक्तिगत टोकन दोनों पर संयोग स्तर से ऊपर अवधि के लिए पूर्वानुमानित हैं।

  • पूर्वानुमित अवधियाँ इतनी सटीक हैं कि सामान्यीकृत समय से मिलीसेकंड पैमाने पर f0 आरेखों को पीछे की ओर परिवर्तित किया जा सके।
  • परिणामी पूर्वानुमित आरेख प्रायोगिक आरेखों के अनुमान लगते हैं और क्रमपरिवर्तन आधार रेखाओं से बेहतर प्रदर्शन करते हैं।

यह पुष्टि करता है कि CEs में भाषा के कालिक पहलुओं को मॉडल करने के लिए पर्याप्त जानकारी होती है, जिससे स्वर लय का अधिक सटीक संश्लेषण संभव होता है।