يقدم الباحثون AutoMem، وهو إطار عمل يعالج إدارة الذاكرة في نماذج اللغات الكبيرة كمهارة قابلة للتدريب بدلاً من مكون ثابت. يرفع النظام عمليات نظام الملفات إلى إجراءات ذاكرة من الدرجة الأولى، مما يسمح للنموذج بقرار كيفية تشفير المعرفة واسترجاعها وتنظيمها بشكل مستقل.

  • تقوم AutoMem بأتمتة محورين للتحسين: هيكل الذاكرة (المطالبات، المخططات، المفردات) وكفاءة النموذج في استخدامها.
  • يقوم نموذج لغوي كبير قوي بمسح مسارات الوكيل لمراجعة هيكل الذاكرة تكرارياً، بينما تعمل قرارات الوكيل الناجحة كإشارات تدريب لزيادة الكفاءة.
  • أظهرت الاختبارات على ألعاب الأفق الطويل المولدة إجرائياً Crafter وMiniHack وNetHack أن تحسين الذاكرة فقط أدى إلى تحسين أداء الوكيل الأساسي بنسبة 2x-4x.
  • جلب هذا النهج نموذج الأوزان المفتوحة بحجم 32B ليكون منافساً للأنظمة المتطورة مثل Claude Opus 4.5 وGemini 3.1 Pro Thinking دون تعديل سلوك المهمة-الإجراء.

تُظهر النتائج أن إدارة الذاكرة هي مهارة قابلة للتعلم بشكل مستقل وهي هدف عالي الأثر لتحقيق مكاسب كبيرة في المهام طويلة الأفق.