著者らは、SEAを発表した。これは、凍結されたベースモデルの周りにステアリングアダプターとバージョン管理されたハーネスを配置し、固定されたエラー予算に対して監査可能な証明を発行するいつでも有効なゲートを通じてのみ変更を認めるアーキテクチャである。
- 5つのループコントローラーが公開された保証を構成し、ループ内の検証者が問題テキストのみから密な信号を提供する。
- 52インスタンスのSWE-bench Verifiedサブセットにおいて、意図的なno-op-composite制御は、Glm 5.2で+4、Gptで+4、Gptで+5という結果をもたらした。
- イベントログは、メカニズムが発火し、単一ランの評価中に回帰を防ぐことを確認している。
このシステムは、自己進化型エージェントにおける学習理論的保証の違反に対処し、変更が監査可能かつ制限されることを保証する。