Notas sobre FastContext de Microsoft y un pequeño experimento de SWE-QA con pistas de recuperación

El autor analiza el artículo de Microsoft sobre FastContext y presenta un enfoque alternativo que utiliza búsqueda semántica fuera de línea para reducir el uso de tokens en agentes de codificación. Al indexar los repositorios por adelantado y proporcionar pistas de rango de archivos a Claude Code, el método logró una reducción del 43,8% en el total de tokens mientras mantenía una calidad de solución equivalente en SWE-QA.

FastContext separa la exploración del repositorio de la resolución utilizando un subagente entrenado, mientras que este experimento utiliza Attemory para indexación y recuperación fuera de línea.
La prueba cubrió 720 muestras emparejadas en 15 repositorios, comparando una línea base de Claude Code con DeepSeek v4 contra la misma configuración con pistas de recuperación.
El uso total de tokens disminuyó un 43,8%, con reducciones tanto en los tokens del agente principal como del subagente, mientras que la puntuación del juez GPT-5.4 permaneció esencialmente sin cambios (83,39 frente a 83,17).
A diferencia del bucle de agente en línea de FastContext, Attemory utiliza recuperación solo de prellenado, evitando la decodificación token por token para la fase de exploración.

Este enfoque demuestra que las pistas de recuperación fuera de línea simples pueden reducir significativamente los costos de contexto sin requerir un explorador entrenado especializado, ofreciendo una alternativa más ligera para agentes de codificación.