Benchmark · agentic

Terminal-Bench

Real-world terminal/CLI agent tasks.

0 परिणाम 0 मॉडल

इस benchmark के लिए अभी तक कोई सत्यापित स्कोर रिपोर्ट नहीं किया गया है।