Автоматизированная оптимизация промптов для агентов на основе ЛЛМ

Новый фреймворк автоматизирует улучшение промптов для агентов на основе ЛЛМ, разделяя поток от наблюдения до действия на модули с целью и выбора действия. Он использует эволюционный цикл, управляемый ЛЛМ, для итеративного улучшения промптов на основе обратной связи от среды, достигая до 72,5% успеха в PutNext, где предыдущие агенты не справлялись, без тонкой настройки модели.

Бенчмарки

Бенчмарк	Модель	Результат
PutnamBench	our framework	72.5%
PutnamBench	RobustCoTAgent	0%

Бенчмарк

Модель

Результат

PutnamBench

our framework

72.5%

PutnamBench

RobustCoTAgent