उपयोगकर्ता जटिल तर्क के लिए 144GB VRAM और 120GB RAM को भरने के लिए बड़े मॉडल खोज रहा है

r/LocalLLaMA पर एक उपयोगकर्ता ऐसे बड़े भाषा मॉडलों की सिफारिशें ढूंढ रहे हैं जो उनके हार्डवेयर की 144GB VRAM और 120GB RAM की पूर्ण क्षमता का उपयोग कर सकें। पोस्ट करने वाले वर्तमान में Qwen3.6 27B और Gemma4 31B का उपयोग कर रहे हैं लेकिन जटिल तर्क, कोडिंग और टूल कॉलिंग के लिए एक अधिक शक्तिशाली विकल्प चाहते हैं।

वर्तमान सेटअप में Q6 क्वांटीज़ेशन पर Minimax M2.7 शामिल है, जिसके लिए KV कैश और संदर्भ स्थान के अलावा 207GB बेस मेमोरी की आवश्यकता होती है।
उपयोगकर्ता Q3 क्वांटीज़ेशन पर Minimax M3 पर जाने या अन्य "बड़े" मॉडल खोजने के बीच विचार-विमर्श कर रहे हैं।
लक्ष्य उन कार्यों के लिए बुद्धिमत्ता को अधिकतम करना है जिनमें उत्तर देने में बहुत समय लग सकता है, गति की तुलना में सटीकता को प्राथमिकता देते हुए।

पोस्ट समुदाय की तुलनाओं को आमंत्रित करता है, विशेष रूप से यह पूछ रहा है कि क्या M3@Q3, M2.7@Q6 के समतुल्य है, ताकि उनके विशिष्ट हार्डवेयर प्रतिबंधों के लिए सर्वोत्तम मॉडल का निर्णय लेने में मदद मिल सके।