AutoMem LLMs के लिए स्मृति को एक संज्ञानात्मक कौशल के रूप में सीखने को स्वचालित करता है

शोधकर्ताओं ने AutoMem पेश किया, एक फ्रेमवर्क जो बड़े भाषा मॉडलों में स्मृति प्रबंधन को एक स्थिर घटक के बजाय एक प्रशिक्षणीय कौशल के रूप में मानता है। सिस्टम फ़ाइल-सिस्टम ऑपरेशन को पहली श्रेणी की स्मृति क्रियाओं में बढ़ावा देता है, जिससे मॉडल ज्ञान को एन्कोड, पुनर्प्राप्त और संगठित करने के तरीके का स्वायत्त रूप से निर्णय ले सकता है।

AutoMem सुधार के दो अक्षों को स्वचालित करता है: स्मृति संरचना (प्रॉम्प्ट्स, स्कीमा, शब्दावली) और मॉडल द्वारा इसे उपयोग करने में उसकी कुशलता।
एक मजबूत LLM एजेंट के ट्रैजेक्टरी की समीक्षा करता है ताकि स्मृति संरचना को पुनः समीक्षित कर सके, जबकि एजेंट के सफल निर्णय कुशलता को तेज करने के लिए प्रशिक्षण संकेतों के रूप में कार्य करते हैं।
प्रक्रियात्मक रूप से उत्पन्न लंबे-अवधि गेम Crafter, MiniHack और NetHack पर परीक्षण ने दिखाया कि केवल स्मृति को अनुकूलित करने से बेस एजेंट प्रदर्शन 2x-4x से बेहतर हो गया।
इस दृष्टिकोण ने 32B ओपन-वेट मॉडल को Claude Opus 4.5 और Gemini 3.1 Pro Thinking जैसे फ्रंटियर सिस्टम के साथ प्रतिस्पर्धी बना दिया, बिना टास्क-एक्शन व्यवहार में संशोधन किए।

परिणाम दिखाते हैं कि स्मृति प्रबंधन एक स्वतंत्र रूप से सीखने योग्य कौशल है और लंबे-अवधि कार्यों में महत्वपूर्ण लाभ प्राप्त करने के लिए एक उच्च-लीवरेज उद्देश्य है।