लेखकों ने SEA प्रस्तुत किया, एक आर्किटेक्चर जो स्व-संशोधन को एक फ्रोजन बेस मॉडल के चारों ओर एक स्टीयरिंग एडाप्टर और वर्श्ड हैर्नेस तक सीमित करता है, किसी भी समय मान्य गेट के माध्यम से ही परिवर्तनों को स्वीकार करता है जो एक निश्चित त्रुटि बजेट के खिलाफ जाँच योग्य प्रमाण पत्र उत्पन्न करता है।
- पांच लूप नियंत्रक प्रकाशित गारंटीओं को संयोजित करते हैं, जबकि लूप में सत्यापक तंत्र केवल समस्या पाठ से घन सिग्नल प्रदान करते हैं।
- 52 उदाहरणों वाले SWE-bench Verified उपसमुच्चय पर, जानबूझकर no-op-composite नियंत्रण सेट का योगदान Glm 5.2 के लिए +4 और Gpt के लिए +5 के रूप में अलग करता है।
- इवेंट लॉग पुष्टि करते हैं कि तंत्र एकल-रन मूल्यांकन के दौरान फायर होते हैं और रीग्रेशन को रोकते हैं।
सिस्टम स्व-विकासशील एजेंटों में सीखने-सैद्धांतिक गारंटी के उल्लंघन को हल करता है यह सुनिश्चित करके कि संशोधन जाँच योग्य और सीमित हैं।