एक अध्ययन का मूल्यांकन करता है कि क्लस्टर-आधारित सेमांटिक चंकिंग, फिक्स्ड-साइज़ और रिकर्सिव चंकिंग रणनीतियों की तुलना में Retrieval-Augmented Generation (RAG) प्रणालियों में पुनर्प्राप्ति और उत्तर गुणवत्ता को सुधारती है या नहीं। मूल्यांकन RAGAs फ्रेमवर्क का उपयोग करके लंबी, संरचित अकादमिक थीसिस पर केंद्रित है।

  • परीक्षण किए गए कॉन्फ़िगरेशन के तहत क्लस्टर-आधारित चंकिंग ने सरल रणनीतियों को पार नहीं किया।
  • फिक्स्ड प्रश्नों बनाम दस्तावेज़-विशिष्ट प्रश्नों पर प्रदर्शन काफी भिन्न था, जो संभवतः दस्तावेज़ फॉर्मेटिंग और पूर्व-प्रसंस्करण से संबंधित है।
  • इस सेटअप में RAGAs-आधारित फिदेलिटी की विश्वसनीयता सीमित थी।

निष्कर्ष सुझाव देते हैं कि इस विशिष्ट उपयोग मामले के लिए अधिक जटिल चंकिंग विधियाँ सरल दृष्टिकोणों की तुलना में कोई लाभ नहीं प्रदान कर सकती हैं।