Arsitektur Konteks Generasional: Menyelesaikan Rotasi Konteks LLM

Arsitektur Konteks Generasional (GCA) mengusulkan untuk memperlakukan jendela konteks LLM sebagai masa hidup yang terbatas, bukan penyimpanan tak terbatas, guna menyelesaikan "rotasi konteks" dan pengenceran perhatian dalam sistem multi-agen. Dengan menerapkan mortalitas buatan, agen diakhiri sebelum kinerjanya menurun, meneruskan keadaan mereka ke generasi baru melalui brankas Markdown file datar.

GCA mengatasi degradasi konteks yang terjadi jauh sebelum batas token keras, seperti penurunan kinerja signifikan pada 50K token dalam jendela 200K.
Sistem menggunakan orkestrator backend deterministik (misalnya, Next.js) untuk mengelola siklus hidup agen, memisahkan penalaran probabilistik dari manajemen keadaan.
"Agen Bayangan" memantau Agen Utama dan menyuntikkan prompt terminasi ketika konteks mencapai ambang batas seperti 85% kapasitas.
Agen menyusun ringkasan XML terkompresi dari keadaan mereka ke dalam brankas Markdown lokal sebelum diakhiri.
Generasi baru membaca "otak eksternal" ini untuk melanjutkan tugas dengan memori kerja yang segar dan tidak berantakan tanpa beban komputasi berat.

Pendekatan ini menghasilkan memori operasional tak terbatas dan menjaga penalaran agen tetap tajam dengan menghindari biaya komputasi dan kehilangan informasi yang terkait dengan ingestion konteks masif atau kompresi.