media r/LocalLLaMA · há 1 h · fonte: há 3 d · open_models

Usuário do Reddit pergunta sobre o maior modelo denso que cabe em 128 GB de RAM com MXFP4

Traduzido do English → Português (BR)

Um usuário do Reddit postou uma pergunta buscando identificar o maior modelo de linguagem denso que possa caber em 128 GB de RAM ao usar quantização MXFP4.

O post expressa frustração com os modelos Claude da Anthropic e seus vieses geopolíticos percebidos, declarando preferência por implantação local em vez de pagar pelo acesso à API.

Importância 0/3 r/LocalLLaMA Inference efficiency

Ler original