A Arquitetura de Contexto Geracional (GCA) propõe tratar a janela de contexto de um LLM como uma vida útil finita, em vez de armazenamento infinito, para resolver a "degradação do contexto" e a diluição da atenção em sistemas multiagente. Ao impor mortalidade artificial, os agentes são encerrados antes que o desempenho se degrade, transferindo seu estado para novas gerações por meio de um cofre Markdown em arquivo plano.

  • A GCA aborda a degradação do contexto que ocorre muito antes dos limites rígidos de tokens, como quedas significativas de desempenho em 50K tokens em uma janela de 200K.
  • O sistema usa um orquestrador de back-end determinístico (por exemplo, Next.js) para gerenciar os ciclos de vida dos agentes, separando o raciocínio probabilístico do gerenciamento de estado.
  • Um "Agente Sombra" monitora o Agente Primário e injeta um prompt de encerramento quando o contexto atinge um limite como 85% da capacidade.
  • Os agentes compilam um resumo XML comprimido de seu estado em um cofre Markdown local antes de serem encerrados.
  • As novas gerações leem este "cérebro externo" para continuar as tarefas com uma memória de trabalho fresca e sem bagunça, sem a sobrecarga pesada de computação.

Essa abordagem resulta em memória operacional infinita e mantém o raciocínio dos agentes afiado, evitando os custos computacionais e a perda de informações associados à ingestão ou compressão massiva de contexto.