DRFLOW introduce un benchmark para evaluar la capacidad de los agentes de predecir flujos de trabajo personalizados a partir de fuentes heterogéneas. Incluye 100 tareas en cinco dominios, fundamentadas en 3,900 fuentes y con 1,246 pasos de flujo de trabajo de referencia. DRFLOW-Agent logra hasta un 10.02% de mejora en F1 sobre las líneas base, pero aún persisten desafíos significativos en la predicción precisa de flujos de trabajo.
DRFLOW: Benchmark para la Predicción de Flujos de Trabajo Personalizados
Traducido del English → Español