يسعى مستخدم في رديت للحصول على نصائح حول ترقية إعداد نموذج اللغة الكبير المحلي الخاص به، ويزن بشكل خاص المقايضة بين سرعة الاستدلال وقدرات المعرفة العامة.

  • يقوم المستخدم حالياً بتشغيل Qwen3.6 35B كمساعد أساسي ووكيل للبرمجة على جهاز Strix Halo.
  • يبلغ عن تحقيق حوالي 30-40 tok/s مع نافذة سياق بحجم 131k.
  • يشعر المستخدم أن النموذج الحالي يفتقر إلى المعرفة العامة الأساسية ويعمل أكثر كمنفذ من كونه مساعداً.
  • لمعالجة هذا، يفكر في الانتقال إلى نموذج Qwen3.5 122B الأكبر حجماً مع محاولة الحفاظ على سرعة مقبولة.