세대 간 컨텍스트 아키텍처(GCA)는 멀티 에이전트 시스템에서 "컨텍스트 부패"와 주의력 희석을 해결하기 위해 LLM의 컨텍스트 창을 무한 저장소가 아닌 유한한 수명으로 취급할 것을 제안합니다. 인공적인 사망을 강제함으로써 성능이 저하되기 전에 에이전트를 종료하고, 평면 파일 Markdown vault를 통해 상태를 새 세대에 전달합니다.
- GCA는 하드 토큰 제한 훨씬 이전에 발생하는 컨텍스트 저하를 해결합니다. 예를 들어 200K 창에서 50K 토큰 시점에서 상당한 성능 저하가 발생합니다.
- 시스템은 확률적 추론과 상태 관리를 분리하여 에이전트 수명 주기를 관리하기 위해 결정론적 백엔드 오케스트레이터(예: Next.js)를 사용합니다.
- "섀도 에이전트"는 기본 에이전트를 모니터링하고 컨텍스트가 85% 용량과 같은 임계값에 도달하면 종료 프롬프트를 주입합니다.
- 에이전트는 종료되기 전에 자신의 상태에 대한 압축된 XML 요약을 로컬 Markdown vault에 컴파일합니다.
- 새 세대는 이 "외부 뇌"를 읽어서 무거운 계산 오버헤드 없이 신선하고 정리된 작업 기억으로 작업을 계속합니다.
이 접근 방식은 무한한 운영 메모리를 제공하며, 대용량 컨텍스트 섭취 또는 압축과 관련된 계산 비용과 정보 손실을 피함으로써 에이전트의 추론을 날카롭게 유지합니다.