Pesquisadores apresentam o PaperPilot, um agente de busca de literatura multi-turno que enquadra a busca científica como indução de fluxo de trabalho para atender intenções de usuário não especificadas e em evolução. Dado um artigo âncora e uma consulta, o sistema constrói um DAG executável de operadores de busca que pode ser refinado por meio de feedback do usuário.

  • PaperPilot-9B supera o agente toolset base Qwen3.5-9B sob interação multi-turno.
  • Hit@5 aumenta de 58.0 para 77.0, MRR de 47.5 para 59.4, e nDCG@10 de 26.8 para 32.5.
  • Erros de execução do fluxo de trabalho são reduzidos de 9.5% para 0%.

Os resultados demonstram que fluxos de trabalho de busca explícitos e editáveis fornecem uma interface eficaz e controlável para alinhar agentes de busca de literatura com intenções científicas complexas.