DeepSpec es una base de código completa lanzada por deepseek-ai para entrenar y evaluar modelos de borrador utilizados en la descodificación especulativa. El proyecto proporciona utilidades de preparación de datos, código de implementación y scripts de evaluación para facilitar el desarrollo de estos modelos auxiliares.
La colección incluye checkpoints para tres algoritmos compatibles: DSpark, DFlash y Eagle3. Los pesos preentrenados están disponibles para modelos objetivo que incluyen Qwen/Qwen3-4B, Qwen/Qwen3-8B, Qwen/Qwen3-14B y google/gemma-4-12B-it.
Se recomienda a los usuarios alinear su configuración con la configuración de entrenamiento del repositorio para garantizar comparaciones significativas. Para aplicaciones específicas de dominio, se recomienda ajustar finamente el modelo de borrador, especialmente si el modelo objetivo opera en modo de pensamiento.