一位Reddit用户发帖提问,希望找出在使用MXFP4量化时能够装入128 GB内存的最大密集语言模型。

该帖子表达了对Anthropic的Claude模型及其感知到的地缘政治偏见的沮丧,并表示更倾向于本地部署而不是付费使用API访问。