← 返回 media r/LocalLLaMA · 1 小时前 · 来源: 3 天前 · open_models Reddit用户询问在128 GB RAM中使用MXFP4时能容纳的最大密集模型 译自 English → 中文 一位Reddit用户发帖提问,希望找出在使用MXFP4量化时能够装入128 GB内存的最大密集语言模型。 该帖子表达了对Anthropic的Claude模型及其感知到的地缘政治偏见的沮丧,并表示更倾向于本地部署而不是付费使用API访问。 重要性 0/3 r/LocalLLaMA Inference efficiency 阅读原文