تطبيق آلية جديدة تُسمى تقييم أهمية التوكن (TIS) التعلم الواعي بالقيود لتحديد والحفاظ على التوكنات المهمة للضغط الفعال لذاكرة التخزين المؤقت KV في نماذج اللغة الكبيرة. تستخدم هذه الطريقة فرض المرساة الصلبة (hard anchor forcing) لمنع مسارات التحسين البسيطة، مما يسمح لانحدار التدرج بتحديد أهمية التوكن بشكل فعال.
- يحقق دقة بنسبة 100% على مهمة الاسترجاع الاصطناعي NIAH بنموذج مُتعلم بميزانية ذاكرة تخزين مؤقت تبلغ 50%.
- يصل إلى 52.8% على معيار LITM للأسئلة والأجوبة الدلالية بميزانية 50% دون تدريب خاص بالاستعلام.
- تتوفر ثلاث نقاط تفتيش، بما في ذلك النموذج الرئيسي (tis-stage3-ert) ومتغير الضغط الشديد (tis-v8b-hard-anchor).
- تم التحقق من صحته على عتاد المستهلك، وتحديداً التشغيل على RTX 5070 بذاكرة فيديو 8GB باستخدام Mistral-7B-v0.3.
يُظهر النظام أن الأهمية المُتعلمة يمكن أن توازي الأداء المثالي (oracle) في المهام الهيكلية مع بقائها قابلة للتنفيذ على وحدات معالجة الرسومات للمستهلكين.