Um usuário do Reddit questiona a utilidade prática da Geração Aumentada por Recuperação (RAG) para projetos pessoais envolvendo codificação, trabalho de sysadmin e pequenas bases de código. O autor argumenta que o conhecimento padrão da indústria já é bem coberto pelos modelos, enquanto fontes de dados específicas como bases de código ou referências de API são muito pequenas para exigir indexação ou grandes demais para serem gerenciadas eficientemente.
- Bibliotecas RFC são consideradas verbosas e desnecessárias.
- Padrões da indústria são tipicamente melhor tratados diretamente pelo modelo do que por documentos selecionados.
- Bases de código pessoais são frequentemente pequenas demais para caber nas janelas de contexto e mudam com frequência demais para uma indexação eficaz.
- Gerenciar referências completas de API para linguagens grandes como C# ou Node.js é visto como um excesso de carga.
- O contexto histórico é considerado relevante apenas para aplicações empresariais em grande escala, não para projetos menores.
A postagem busca conselhos da comunidade sobre qual conteúdo é realmente útil incluir em sistemas RAG e como gerenciar a manutenção de longo prazo para grandes conjuntos de dados como documentação completa de API.