Пользователь Reddit ищет советы о наиболее эффективном методе тестирования производительности моделей на различных уровнях квантования перед покупкой нового оборудования.
- Пользователь намерен купить несколько GPU и конкретно хочет протестировать модели, такие как GLM-5.2.
- Предлагаемое решение заключается в аренде GPU RTX 6000 через платформу Vast.ai для проведения этих тестов.