تقترح هندسة السياق التوليدي (GCA) معالجة نافذة سياق نموذج اللغة الكبير (LLM) كعمر محدود بدلاً من تخزين لا نهائي لحل "تدهور السياق" وتخفيف الانتباه في الأنظمة متعددة الوكلاء. ومن خلال فرض الموت الاصطناعي، يتم إنهاء الوكلاء قبل تدهور أدائهم، ونقل حالتهم إلى الأجيال الجديدة عبر مخزن ماركداون (Markdown) بملف مسطح.
- تعالج GCA تدهور السياق الذي يحدث قبل فترات طويلة من حدود الرموز الصلبة، مثل الانخفاضات الكبيرة في الأداء عند 50 ألف رمز في نافذة تتسع لـ 200 ألف رمز.
- يستخدم النظام منسقًا خلفيًا حتميًا (مثل Next.js) لإدارة دورات حياة الوكلاء، مما يفصل بين الاستدلال الاحتمالي وإدارة الحالة.
- يراقب "الوكيل الظل" الوكيل الرئيسي ويحقن موجه إنهاء عندما يصل السياق إلى عتبة مثل 85% من السعة.
- يقوم الوكلاء بتلخيص حالتهم في ملف XML مضغوط داخل مخزن ماركداون المحلي قبل أن يتم إنشاؤهم.
- تقرأ الأجيال الجديدة هذا "الدماغ الخارجي" لمواصلة المهام بذاكرة عمل جديدة وغير مزدحمة دون عبء حسابي كبير.
هذا النهج يوفر ذاكرة تشغيلية لا نهائية ويحافظ على حدة استدلال الوكلاء من خلال تجنب التكاليف الحسابية وفقدان المعلومات المرتبطة باستهلاك سياق ضخم أو ضغطه.