あなたのRAGには何が入っているか？

あるRedditユーザーが、コーディング、システム管理作業、小規模なコードベースを扱う個人プロジェクトにおける、検索拡張生成（RAG）の実用的な有用性について疑問を呈しています。著者は、標準的な業界知識はすでにモデルによって十分にカバーされていると主張し、コードベースやAPIリファレンスなどの特定のデータソースは、インデックス作成が必要になるほど大きくないか、効率的に管理するには大きすぎる場合があると述べています。

RFCライブラリは冗長で不要と考えられています。
業界標準は、選び抜かれたドキュメントよりもモデルによって直接処理される方が一般的により良い結果をもたらします。
個人用のコードベースは、コンテキストウィンドウに収まるには小さすぎる場合が多く、インデックス作成の効果を上げるには頻繁に変化しすぎます。
C#やNode.jsのような大規模な言語の完全なAPIリファレンスの管理は、過度なオーバーヘッドと見なされています。
歴史的コンテキストは、大規模なエンタープライズアプリケーションにおいてのみ関連性があり、小規模なプロジェクトには当てはまりません。

この投稿は、RAGシステムに実際に含めるべきコンテンツや、完全なAPIドキュメントのような大規模データセットの長期的なメンテナンスをどのように行うかについて、コミュニティからのアドバイスを求めています。