DeepSpec — это полнофункциональная кодовая база, выпущенная deepseek-ai для обучения и оценки моделей-черновиков, используемых в спекулятивном декодировании. Проект предоставляет утилиты подготовки данных, реализацию кода и скрипты оценки для содействия разработке этих вспомогательных моделей.
Коллекция включает чекпоинты для трех поддерживаемых алгоритмов: DSpark, DFlash и Eagle3. Предобученные веса доступны для целевых моделей, включая Qwen/Qwen3-4B, Qwen/Qwen3-8B, Qwen/Qwen3-14B и google/gemma-4-12B-it.
Пользователям рекомендуется настроить свою среду в соответствии с настройками обучения из репозитория, чтобы обеспечить осмысленные сравнения. Для приложений, специфичных для домена, рекомендуется дообучение модели-черновика, особенно если целевая модель работает в режиме размышления.