Los investigadores presentan PaperPilot, un agente de búsqueda de literatura multi-turno que enmarca la búsqueda científica como inducción de flujo de trabajo para abordar intenciones de usuario no especificadas y en evolución. Dado un artículo ancla y una consulta, el sistema construye un DAG ejecutable de operadores de búsqueda que puede refinarse mediante retroalimentación del usuario.
- PaperPilot-9B mejora sobre el agente toolset base Qwen3.5-9B bajo interacción multi-turno.
- Hit@5 aumenta de 58.0 a 77.0, MRR de 47.5 a 59.4, y nDCG@10 de 26.8 a 32.5.
- Los errores de ejecución del flujo de trabajo se reducen de 9.5% a 0%.
Los resultados demuestran que los flujos de trabajo de búsqueda explícitos y editables proporcionan una interfaz efectiva y controlable para alinear agentes de búsqueda de literatura con intenciones científicas complejas.