あるユーザーが、クラウドAPI呼び出しを一切行わないAIエージェント向けの完全ローカルなWeb調査パイプラインについて詳述しています。このアーキテクチャは、検索用に自己ホスト型のSearXNG、キャッシュ/インデックス層のHister、TLS指紋を用いたHTTPフェッチのためのrnet(現在のwreq)、およびヘッドレスブラウザのフォールバックとしてCamoufoxをレイヤー化しています。

  • SearXNGがローカルで初期検索クエリを処理します。
  • Histerは取得したすべてのページを保存し、繰り返しの参照を瞬時に行い、ページが変更または消滅してもコンテンツを保持します。
  • rnet(現在のwreq)はTLS指紋を使用して基本的なボット対策を回避します。
  • Camoufoxは完全なブラウザ操作が必要なJS重厚なページをレンダリングします。
  • ローカルのqwen3-reranker-4bが関連性をスコアリングし、すべてのコンポーネントがMCPサーバー経由で通信します。

キャッシュ層は、元のコンテンツへのアクセスを維持するための最も価値のあるコンポーネントとして強調されています。このスタック全体は、外部依存関係なしで推論モデルと同じボックス上で実行されます。