Benchmark · agentic

τ²-bench

2 results 2 models

ToolGraph ToolGraph+DPO

Timeline

2026-06-23 ToolGraph 0.338% Self-Evolution of Tool-Calling Agents via Divergence-Point Preference Learning
2026-06-23 ToolGraph+DPO 0.355% Self-Evolution of Tool-Calling Agents via Divergence-Point Preference Learning