يقوم المؤلفون بتوصيف تبويب التضمين لذاكرة الأنماط أثناء الاستنتاج في خط أنابيب لمعالجة اللغة الطبيعية السريرية على نطاق الإنتاج، والذي يجمع بين مولد Llama-3.3 70B ومُحقِّق MMed-Llama-3.1 70B عبر 167,034 سردًا من PMC-Patients.
- فشل تعلم قواعد التصفية مباشرة من رفض المُحقِّق لأنها كانت متفرقة جدًا عبر أشكال مميزة.
- تمكنت قاعدة أبسط باستخدام مصطلحات سريرية ثابتة من التقاط 49,734 علاقة تنتهك المصطلحات في مجموعة محفوظة، دون استخدام المُحقِّق.
- فشل أربعة من خمسة مرشحات للإجابة على الأسئلة؛ نجح الخامس عن طريق التحقق مما إذا كانت الكيانات تدعم السؤال، مما أدى إلى وضع علامة على الإجابات المرفوضة بنسبة أكبر بمقدار 1.84 مرة.
- يكون المرشح انتقائيًا فقط عندما يختبر نفس الأدلة التي يزنها المُحقِّق، وليس عندما يقلد إخراج المُحقِّق.
تُظهر الدراسة أن تصاميم الذاكرة الطبيعية يمكن أن تفشل بصمت على النطاق الكبير، وأن انتقائية التضمين قبل التوليد تعتمد على استجواب السؤال الذي يجيب عليه المُحقِّق.