作者提出了SEA,一种将自修改限制于围绕冻结基础模型的转向适配器和版本化框架的架构,仅通过在任何时刻有效的门控来允许更改,该门控针对固定的错误预算发出可审计的证书。
- 五个循环控制器组合了已发布的保证,而循环中的验证器机制仅从问题文本中提供密集信号。
- 在包含52个实例的SWE-bench Verified子集上,故意的no-op-composite控制将套件贡献隔离为Glm 5.2的+4和Gpt的+5。
- 事件日志确认机制在单次运行评估期间触发并防止了回归。
该系统通过确保修改是可审计且有界的,解决了自演化智能体中学习理论保证被违反的问题。