تقوم متابعة للمعايير بتقييم أداء DeepSeek V4 Flash الذي يعمل على بطاقتي RTX PRO 6000 باستخدام vLLM، ومقارنة أدائه في مهام البرمجة الواقعية مع النماذج القائمة على واجهة برمجة التطبيقات مثل Claude Sonnet و Opus. وجدت الدراسة أنه بينما يحافظ Opus و Fable على جودة برمجية متفوقة، يحقق DeepSeek V4 Flash جودة تقارب مستوى Sonnet بأوقات تشغيل (wall-clock times) أسرع بكثير.
- يبلغ متوسط وقت DeepSeek V4 Flash لكل مهمة دقيقتين، في حين يستغرق Sonnet 5 حوالي 6 دقائق، مما يجعله أبطأ بحوالي ثلاثة أضعاف.
- استخدمت الاختبارات OpenCode للنماذج المحلية و Claude Code للنماذج القائمة على واجهة برمجة التطبيقات لتعكس إعدادات المستخدمين النموذجية بدلاً من أداء النماذج المعزولة.
- تم تضمين نماذج Qwen 3.6 كنقاط مرجعية للمقارنة ضمن إطار عمل المعايرة.
تشير النتائج إلى أن النماذج المحلية تصبح تنافسية للغاية من حيث السرعة والجودة، شريطة أن يتمكن المستخدمون من تقليل عبء الانتباه الكثيف (dense attention overheads).