SEA вводит сертификаты, действительные в любой момент, для самоэволюционирующих агентов

Авторы представляют SEA, архитектуру, которая ограничивает самоизменение управляющим адаптером и версионированным каркасом вокруг замороженной базовой модели, допуская изменения только через шлюз, действительный в любой момент, который выдает аудируемые сертификаты против фиксированного бюджета ошибок.

Пять цикловых контроллеров формируют опубликованные гарантии, а механизмы верификатора в контуре обеспечивают плотный сигнал исключительно на основе текста проблем.
На подмножестве SWE-bench Verified из 52 экземпляров преднамеренное управление no-op-composite изолирует вклад набора данных на +4 для Glm 5.2 и +5 для Gpt.
Журналы событий подтверждают, что механизмы срабатывают и предотвращают регрессии во время однократных оценок.

Система решает проблему нарушения теоретико-обучающих гарантий в самоэволюционирующих агентах, обеспечивая аудируемость и ограниченность модификаций.