144GB VRAM 및 120GB RAM을 채울 대규모 모델을 찾는 사용자

r/LocalLLaMA의 한 사용자가 144GB VRAM과 120GB RAM이라는 자신의 하드웨어 전체 용량을 활용할 수 있는 대규모 언어 모델(Large Language Models) 추천을 구하고 있습니다. 게시자는 현재 Qwen3.6 27B와 Gemma4 31B를 사용하고 있지만, 복잡한 추론, 코딩 및 도구 호출을 위해 더 강력한 옵션을 원합니다.

현재 설정에는 기본 메모리에 207GB가 필요하며 KV 캐시와 컨텍스트 공간도 추가되는 Q6 양자화된 Minimax M2.7이 포함됩니다.
사용자는 Q3 양자화된 Minimax M3로 전환할지, 아니면 다른 "거대한" 모델을 찾을지 고민 중입니다.
목표는 답변에 오랜 시간이 걸릴 수 있는 작업에 대해 지능을 최대화하고 속성보다 정확성을 우선시하는 것입니다.

이 게시물은 커뮤니티 비교를 요청하며, 특히 M3@Q3가 M2.7@Q6와 동등한지 여부를 묻고 있어 특정 하드웨어 제약 조건에 맞는 최적의 모델을 결정하는 데 도움을 줍니다.