Пользователь Reddit ищет советы о наиболее эффективном методе тестирования производительности моделей на различных уровнях квантования перед покупкой нового оборудования.

  • Пользователь намерен купить несколько GPU и конкретно хочет протестировать модели, такие как GLM-5.2.
  • Предлагаемое решение заключается в аренде GPU RTX 6000 через платформу Vast.ai для проведения этих тестов.