korshunov
.ai
Русский
Сегодня
Неделя
Все статьи
Бенчмарк · agentic
Windows Agent Arena
1 результатов
1 моделей
0
3.5
7
10.5
14
2026-06-29
proposed RL fine-tuning framework · 12.6 · 2026-06-29
proposed RL fine-tuning framework
Хронология
2026-06-29
proposed RL fine-tuning framework
12.6pts
Обучение с подкреплением для агентов управления компьютером с автономной оценкой