يقدم الباحثون "الإجابة في السياق"، وهو تشخيص يقيس ما إذا كانت الإجابات الذهبية تبقى كسلاسل متصلة في سياقات القارئ المعبأة، محاججين بأنه يتفوق على استدعاء المستندات لتوليد النصوص المعزز بالاسترجاع بميزانية مقيدة. يقترحون أيضًا صياغة بناء سياق القارئ كتعظيم فرعي محدود ومتزايد لتحقيق الصلة والتغطية والتمثيل والتنوع بشكل مشترك.

  • تتنبأ الإجابة في السياق بـ F1 للإجابة بشكل أفضل من الاستدعاء (r=0.39-0.55 مقابل ~0.31) وتفصل جودة الإجابة بخمسة أضعاف على HotpotQA.
  • يتفوق المجمع الفرعي المحدب على MMR والتعبئة البسيطة بنسبة تصل إلى +5.1 F1 على HotpotQA بميزانية 160 رمز وقارئ بحجم 3B.
  • تتطلب المكاسب بنية متعددة المراحل، واسترجاع فعالًا، وميزانيات مقيدة، وقراء تكون فيها كثافة الأدلة هي الاختناق.
  • يتم امتصاص الميزة على الحيل من قبل النماذج ذات الـ 7B وعكسها بواسطة النماذج ذات الـ 14B، كما يفسر التشخيص.

توضح الدراسة أن تحسين بقاء الإجابة بدلاً من الاستدعاء يحسن الأداء في سيناريوهات متعددة المراحل محددة بميزانيات سياق محدودة.