Les auteurs présentent SEA, une architecture qui confine l'auto-modification à un adaptateur de direction et à un harnais versionné autour d'un modèle de base figé, n'admettant des changements que par une porte toujours valide qui émet des certificats auditables contre un budget d'erreur fixe.

  • Cinq contrôleurs de boucle composent les garanties publiées, tandis que les mécanismes de vérificateur dans la boucle fournissent un signal dense à partir du seul texte des problèmes.
  • Sur un sous-ensemble SWE-bench Verified de 52 instances, le contrôle no-op-composite délibéré isole la contribution de la suite à +4 pour Glm 5.2 et +5 pour Gpt.
  • Les journaux d'événements confirment que les mécanismes se déclenchent et empêchent les régressions lors des évaluations en une seule exécution.

Le système traite la violation des garanties théoriques de l'apprentissage dans les agents auto-évoluants en s'assurant que les modifications sont auditables et bornées.