Benchmark · agentic

Windows Agent Arena

1 resultados 1 modelos
0 3.5 7 10.5 14 2026-06-29 proposed RL fine-tuning framework · 12.6 · 2026-06-29
proposed RL fine-tuning framework
Cronología
  1. 2026-06-29 proposed RL fine-tuning framework 12.6pts Aprendizaje por Refuerzo para Agentes de Uso Informático con Evaluación Autónoma