Para penulis menyajikan SEA, sebuah arsitektur yang membatasi modifikasi diri pada adaptor kemudi dan harness versi di sekitar model dasar beku, mengakui perubahan hanya melalui gerbang yang selalu valid yang mengeluarkan sertifikat yang dapat diaudit terhadap anggaran kesalahan tetap.

  • Lima pengontrol loop menyusun jaminan yang diterbitkan, sementara mekanisme verifier-in-the-loop menyediakan sinyal padat hanya dari teks masalah.
  • Pada subset SWE-bench Verified 52-instance, kontrol no-op-composite yang disengaja mengisolasi kontribusi suite sebesar +4 untuk Glm 5.2 dan +5 untuk Gpt.
  • Log peristiwa mengonfirmasi bahwa mekanisme memicu dan mencegah regresi selama evaluasi single-run.

Sistem ini menangani pelanggaran jaminan teori pembelajaran pada agen yang berevolusi sendiri dengan memastikan modifikasi dapat diaudit dan terbatas.