يقدم المؤلفون SEA، وهي بنية تحصر التعديل الذاتي في محول توجيه وإطار عمل مُدرَّج حول نموذج أساسي متجمد، وتقبل التغييرات فقط عبر بوابة صالحة في أي وقت تصدر شهادات قابلة للتدقيق ضد ميزانية خطأ ثابتة.
- تتألف خمسة متحكمات حلقة من الضمانات المنشورة، بينما توفر آليات المُتحقق داخل الحلقة إشارة كثيفة من نص المشكلة وحده.
- على مجموعة فرعية SWE-bench Verified المكونة من 52 حالة، يعزل التحكم no-op-composite المتعمد مساهمة المجموعة بـ +4 لـ Glm 5.2 و+5 لـ Gpt.
- تؤكد سجلات الأحداث أن الآليات تنشط وتمنع الانحدار أثناء التقييمات ذات التشغيل الواحد.
يعالج النظام انتهاك ضمانات نظرية التعلم في الوكلاء ذاتي التطور من خلال ضمان أن التعديلات قابلة للتدقيق ومحدودة.