مستخدم يبحث عن نماذج كبيرة لملء 144 جيجابايت من ذاكرة الفيديو و120 جيجابايت من الذاكرة العشوائية للاستدلال المعقد

يبحث مستخدم في r/LocalLLaMA عن توصيات لنماذج لغوية كبيرة يمكنها الاستفادة من السعة الكاملة لأجهزته، وهي 144 جيجابايت من ذاكرة الفيديو (VRAM) و120 جيجابايت من الذاكرة العشوائية (RAM). يستخدم منشور الموضوع حالياً Qwen3.6 27B وGemma4 31B لكنه يريد خياراً أقوى للاستدلال المعقد، والبرمجة، واستدعاء الأدوات.

تتضمن التكوين الحالي Minimax M2.7 بكمّية Q6، مما يتطلب 207 جيجابايت من الذاكرة الأساسية بالإضافة إلى ذاكرة التخزين المؤقت KV ومساحة السياق.
يناقش المستخدم الانتقال إلى Minimax M3 بكمّية Q3 أو البحث عن نماذج "ضخمة" أخرى.
الهدف هو تعظيم الذكاء للمهام التي قد تستغرق وقتاً طويلاً للإجابة، مع إعطاء الأولوية للدقة على السرعة.

يدعو المنشور إلى مقارنات من المجتمع، ويسأل تحديداً عما إذا كان M3@Q3 يعادل M2.7@Q6، لمساعدة في تحديد النموذج الأفضل لقيود الأجهزة الخاصة بهم.