Los autores presentan un framework para evaluar y comparar la generación aumentada por recuperación (RAG) regular, GraphRAG, Modular y Agentic en bases de conocimiento semi-estructuradas. Implementan nueve escenarios estandarizados que abarcan desde la recuperación simple de documentos hasta la integración híbrida compleja de texto-grafo y la planificación multi-paso agéntica. Se presenta un método novedoso de ingeniería de contexto para abordar problemas de desbordamiento de memoria en variantes avanzadas de RAG mediante nuevas representaciones y diseño de bucle agéntico. Esta optimización logra una reducción del 19% al 53% en el uso de tokens mientras gestiona eficientemente las recuperaciones. Un análisis adicional revela una brecha entre recuperación y generación donde la expansión de la recuperación no mejora proporcionalmente la calidad de la generación. El estudio sugiere que las métricas actuales orientadas a la recuperación pueden exagerar los beneficios de las técnicas avanzadas de recuperación. Estas perspectivas basadas en datos tienen como objetivo guiar el desarrollo de sistemas RAG inteligentes listos para producción.
Framework Evalúa Cuándo se Necesitan GraphRAG y Agentic RAG
Traducido del English → Español