El Eagle3 ha aterrizado para Qwen
El modelo de decodificación especulativa Eagle3 ya está disponible en la última versión de llama.cpp mediante --spec-type draft-eagle3. Requiere un modelo borrador, como Ex0bit-Qwen3.6-27B-PRISM-EAGLE3-GGUF, y puede usarse con -md o --model-draft. El rendimiento es comparable al de draft-mtp, aunque no se admite paralelismo de tensor y el uso de VRAM es mayor.