media r/LocalLLaMA · 1 小时前 · 来源： 3 天前 · open_models

Reddit用户询问在128 GB RAM中使用MXFP4时能容纳的最大密集模型

译自 English → 中文

一位Reddit用户发帖提问，希望找出在使用MXFP4量化时能够装入128 GB内存的最大密集语言模型。

该帖子表达了对Anthropic的Claude模型及其感知到的地缘政治偏见的沮丧，并表示更倾向于本地部署而不是付费使用API访问。

重要性 0/3 r/LocalLLaMA Inference efficiency