144GB VRAMと120GB RAMを埋める大規模モデルを求めるユーザー

r/LocalLLaMAのユーザーは、144GBのVRAMと120GBのRAMという自機のフル容量を活用できる大規模言語モデルの推奨を求めています。投稿者は現在Qwen3.6 27BとGemma4 31Bを使用していますが、複雑な推論、コーディング、ツール呼び出しのためにより強力なオプションを望んでいます。

現在のセットアップには、ベースメモリに207GBに加えKVキャッシュとコンテキスト領域が必要なQ6量子化のMinimax M2.7が含まれます。
ユーザーはQ3量子化のMinimax M3に移行するか、他の「巨大な」モデルを探すかについて検討しています。
目標は、回答に長時間かかるタスクに対して知能を最大化し、速度よりも正確性を優先することです。

この投稿はコミュニティによる比較を呼びかけ、特にM3@Q3がM2.7@Q6と同等かどうかを尋ね、特定のハードウェア制約に対する最適なモデルの決定を助けています。