世代間コンテキストアーキテクチャ(GCA)は、マルチエージェントシステムにおける「コンテキスト劣化」と注意散漫を解決するために、LLMのコンテキストウィンドウを無限のストレージではなく有限の寿命として扱うことを提案しています。人工的な寿命制限を課すことで、パフォーマンスが低下する前にエージェントを終了させ、その状態をフラットファイルのMarkdown vaultを通じて次世代に渡します。
- GCAは、ハードなトークン制限よりもはるかに早く発生するコンテキスト劣化に対処します。例えば、200Kのウィンドウにおいて50Kトークン時点で著しいパフォーマンス低下が生じます。
- システムは確定的なバックエンドオーケストレーター(例:Next.js)を使用してエージェントのライフサイクルを管理し、確率的推論と状態管理を分離します。
- 「シャドウエージェント」がプライマリエージェントを監視し、コンテキストが85%という閾値に達した時点で終了プロンプトを注入します。
- エージェントは終了する前に、自身の状態の圧縮XMLサマリーをローカルのMarkdown vaultにコンパイルします。
- 次世代はこの「外部脳」を読み取り、重い計算オーバーヘッドなしで、新鮮で整理された作業記憶を使用してタスクを継続します。
このアプローチにより、無限の操作メモリが実現し、大量のコンテキスト読み込みや圧縮に伴う計算コストと情報損失を回避することで、エージェントの推論を鋭敏に保ちます。