Peneliti memperkenalkan AutoMem, sebuah kerangka kerja yang memperlakukan manajemen memori dalam model bahasa besar sebagai keterampilan yang dapat dilatih daripada komponen statis. Sistem ini meningkatkan operasi sistem file menjadi tindakan memori kelas satu, memungkinkan model secara otonom memutuskan cara mengkodekan, mengambil, dan mengatur pengetahuan.
- AutoMem mengotomatisasi dua sumbu peningkatan: struktur memori (prompt, skema, kosakata) dan keahlian model dalam menggunakannya.
- LLM yang kuat meninjau lintasan agen untuk secara iteratif merevisi struktur memori, sementara keputusan sukses agen berfungsi sebagai sinyal pelatihan untuk mempertajam keahlian.
- Pengujian pada game horizon panjang yang dihasilkan secara prosedural Crafter, MiniHack, dan NetHack menunjukkan bahwa mengoptimalkan memori saja meningkatkan kinerja agen dasar sebesar 2x-4x.
- Pendekatan ini membawa model open-weight 32B menjadi kompetitif dengan sistem terdepan seperti Claude Opus 4.5 dan Gemini 3.1 Pro Thinking tanpa memodifikasi perilaku tugas-aksi.
Hasilnya menunjukkan bahwa manajemen memori adalah keterampilan yang dapat dipelajari secara independen dan tujuan dengan leverage tinggi untuk mencapai peningkatan signifikan dalam tugas horizon panjang.