korshunov
.ai
Русский
Сегодня
Неделя
Все статьи
Бенчмарк · agentic
τ²-bench
2 результатов
2 моделей
0
0.2
0.5
0.8
1
2026-06-23
ToolGraph · 0.3 · 2026-06-23
ToolGraph+DPO · 0.4 · 2026-06-23
ToolGraph
ToolGraph+DPO
Хронология
2026-06-23
ToolGraph
0.338%
Саморазвитие агентов, использующих инструменты, через обучение предпочтений в точках разрыва
2026-06-23
ToolGraph+DPO
0.355%
Саморазвитие агентов, использующих инструменты, через обучение предпочтений в точках разрыва