研究者らは、PaperPilotを発表した。これは、 underspecified で変化するユーザー意図に対処するため、科学的事項の検索をワークフロー誘導として捉えるマルチターンの文献検索エージェントである。アンカー論文とクエリを与えると、システムは検索演算子の実行可能なDAGを構築し、ユーザーフィードバックを通じてこれを精緻化できる。

  • PaperPilot-9Bは、マルチターン対話においてベースラインのQwen3.5-9Bツールセットエージェントを上回る。
  • Hit@5が58.0から77.0に、MRRが47.5から59.4に、nDCG@10が26.8から32.5に向上。
  • ワークフロー実行エラーは9.5%から0%に削減された。

これらの結果は、明示的で編集可能な検索ワークフローが、複雑な科学的事項の意図と文献検索エージェントを整合させるための効果的で制御可能なインターフェースを提供することを示している。