SkillOpt: Навыки агентов как обучаемые параметры
Microsoft Research представляет SkillOpt — метод, который рассматривает файлы навыков агента как обучаемые параметры вне замороженной целевой модели, превращая ручное редактирование навыков в контролируемый процесс оптимизации. Этот подход повышает надежность и согласованность работы агентов без обновления весов базовой модели.