Benchmark · agentic
Terminal-Bench
Real-world terminal/CLI agent tasks.
Belum ada skor terverifikasi yang dilaporkan untuk benchmark ini.
Real-world terminal/CLI agent tasks.
Belum ada skor terverifikasi yang dilaporkan untuk benchmark ini.