Пользователь Reddit задал вопрос, пытаясь определить самую большую плотную языковую модель, которая может поместиться в 128 ГБ оперативной памяти при использовании квантования MXFP4.
В посте выражается разочарование моделями Claude от Anthropic и их предполагаемыми геополитическими предубеждениями, а также указывается предпочтение локальному развертыванию вместо оплаты доступа по API.