La Arquitectura de Contexto Generacional (GCA) propone tratar la ventana de contexto de un LLM como una vida útil finita en lugar de almacenamiento infinito para resolver la "rotación del contexto" y la dilución de la atención en sistemas multi-agente. Al imponer mortalidad artificial, los agentes se terminan antes de que su rendimiento se degrade, pasando su estado a nuevas generaciones mediante un almacén de archivos Markdown plano.
- GCA aborda la degradación del contexto que ocurre mucho antes de los límites duros de tokens, como caídas significativas de rendimiento en 50K tokens dentro de una ventana de 200K.
- El sistema utiliza un orquestador de backend determinista (por ejemplo, Next.js) para gestionar los ciclos de vida de los agentes, separando el razonamiento probabilístico de la gestión del estado.
- Un "Agente Sombra" monitorea al Agente Principal e inyecta una instrucción de terminación cuando el contexto alcanza un umbral como el 85% de capacidad.
- Los agentes compilan un resumen XML comprimido de su estado en un almacén local de Markdown antes de ser terminados.
- Las nuevas generaciones leen este "cerebro externo" para continuar las tareas con una memoria de trabajo fresca y sin desorden, sin una sobrecarga computacional significativa.
Este enfoque produce una memoria operativa infinita y mantiene el razonamiento de los agentes agudo al evitar los costos computacionales y la pérdida de información asociados con la ingestión o compresión masiva del contexto.