अध्ययन से पता चलता है कि केवल-डिकोडर भाषा मॉडल की छिपी हुई अवस्थाएं इनपुट पुनर्प्राप्ति की अनुमति देती हैं

यह कार्य निरंतर एम्बेडिंग-स्पेस अनुकूलन के माध्यम से उनकी अंतिम-परत छिपी हुई अवस्थाओं से मूल इनपुट टोकन अनुक्रमों को पुनर्प्राप्त करके केवल-डिकोडर भाषा मॉडल के व्युत्क्रमण का जांच करता है।

विधि निरंतर स्थान में एक सॉफ्ट प्रॉक्सी का उपयोग करती है, आंतरिक संकेतों जैसे रैंक ट्राजेक्टरी और हानि वक्रों को उजागर करने के लिए केवल आंतरिक लूप के अंत में ही टोकन को प्रतिबद्ध करती है।
विश्लेषण से एक तीव्र श्रेणीय असममिति दिखाई देती है जहां स्थान-पूर्वसंज्ञक कार्यात्मक शब्द विफलता का कारण बनते हैं जबकि सामग्री-वाहक टोकन लगभग पूर्णतः पुनर्प्राप्त होते हैं।
10-टोकन C4 प्रॉम्प्ट पर, उम्मीदवार खिड़की चौड़ी होने के साथ सटीक-मैच दरें 66.9% से बढ़कर 97.5% हो जाती हैं, जो संकेत देता है कि अधिकांश त्रुटियां पुनर्प्राप्त योग्य नजदीकी मिस हैं।
निरंतर सूत्रीकरण अनुकूलन को अवलोकनीय और विफलताओं को पता लगाने योग्य बनाता है, SIPIT जैसे तेज़ प्रति-चरण कठिन प्रक्षेपण विधियों के विपरीत।

परिणाम दर्शाते हैं कि GPT-2 की अंतिम-परत छिपी हुई अवस्थाएं इनपुट पाठ के लिए अत्यधिक संवेदनशील हैं, जिससे मूल अनुक्रम की प्रभावी पुनर्प्राप्ति संभव होती है।