Бенчмарк · agentic

Windows Agent Arena

1 результатов 1 моделей
0 3.5 7 10.5 14 2026-06-29 proposed RL fine-tuning framework · 12.6 · 2026-06-29
proposed RL fine-tuning framework
Хронология
  1. 2026-06-29 proposed RL fine-tuning framework 12.6pts Обучение с подкреплением для агентов управления компьютером с автономной оценкой