Заметки о FastContext от Microsoft и небольшой эксперимент SWE-QA с подсказками для поиска

Автор анализирует статью Microsoft о FastContext и предлагает альтернативный подход с использованием офлайн-семантического поиска для снижения расхода токенов в агентах для программирования. Индексируя репозитории заранее и предоставляя подсказки по диапазонам файлов для Claude Code, метод позволил сократить общее количество токенов на 43,8%, сохранив эквивалентное качество решений в SWE-QA.

FastContext разделяет исследование репозитория и решение задачи с помощью обученного субагента, тогда как этот эксперимент использует Attemory для офлайн-индексации и поиска.
Тестирование охватило 720 парных выборок из 15 репозиториев, сравнивая базовый вариант Claude Code с DeepSeek v4 с тем же набором, но с подсказками для поиска.
Общее количество токенов уменьшилось на 43,8%, при этом сократился расход как у основного агента, так и у субагента, в то время как оценка судьи GPT-5.4 осталась практически неизменной (83,39 против 83,17).
В отличие от онлайн-цикла агента FastContext, Attemory использует поиск только на этапе префиллинга, избегая посимвольного декодирования для фазы исследования.

Этот подход демонстрирует, что простые подсказки офлайн-поиска могут существенно снизить затраты контекста без необходимости в специализированном обученном исследователе, предлагая более легковесную альтернативу для агентов программирования.