Um usuário do Reddit postou uma pergunta buscando identificar o maior modelo de linguagem denso que possa caber em 128 GB de RAM ao usar quantização MXFP4.

O post expressa frustração com os modelos Claude da Anthropic e seus vieses geopolíticos percebidos, declarando preferência por implantação local em vez de pagar pelo acesso à API.