يسعى مستخدم في رديت للحصول على نصائح حول ترقية إعداد نموذج اللغة الكبير المحلي الخاص به، ويزن بشكل خاص المقايضة بين سرعة الاستدلال وقدرات المعرفة العامة.
- يقوم المستخدم حالياً بتشغيل Qwen3.6 35B كمساعد أساسي ووكيل للبرمجة على جهاز Strix Halo.
- يبلغ عن تحقيق حوالي 30-40 tok/s مع نافذة سياق بحجم 131k.
- يشعر المستخدم أن النموذج الحالي يفتقر إلى المعرفة العامة الأساسية ويعمل أكثر كمنفذ من كونه مساعداً.
- لمعالجة هذا، يفكر في الانتقال إلى نموذج Qwen3.5 122B الأكبر حجماً مع محاولة الحفاظ على سرعة مقبولة.