研究人员推出了 PaperPilot,这是一种多轮文献搜索代理,将科学搜索框架为工作流归纳,以解决未明确定义和不断演变的用户意图。给定锚定论文和查询,系统构建可执行的操作符 DAG,并可通过用户反馈进行优化。

  • 在多轮交互下,PaperPilot-9B 优于基础 Qwen3.5-9B toolset 代理。
  • Hit@5 从 58.0 提升至 77.0,MRR 从 47.5 提升至 59.4,nDCG@10 从 26.8 提升至 32.5。
  • 工作流执行错误率从 9.5% 降至 0%。

结果表明,显式、可编辑的搜索工作流为将文献搜索代理与复杂的科学意图对齐提供了有效且可控的接口。