Пользователь r/LocalLLaMA рассматривает обновление аппаратного обеспечения: переход от двух GPU RTX 3090 к четырем картам RTX 5070 Ti, конкретно оценивая влияние на производительность при однопоточном выводе.

  • Предлагаемая конфигурация использует материнскую плату Asus Proart Creator B850 Neo с распределением линий PCIe 5.0 в режиме 4x/4x/4x/4x.
  • Установка карт в оба основных слота x16 разделяет 16 линий процессора на режим PCIe 5.0 x8/x8, в то время как два слота M.2 получают выделенные полноскоростные подключения.
  • Пользователь ищет отзывы сообщества о производительности Qwen 3.6 27b с использованием базовых весов 4-bit и конфигурации KV-Cache 8-bit.

Обсуждение подчеркивает скептицизм по поводу консервативных прогнозов Google о том, что линии PCIe станут узким местом для скорости вывода, отмечая предыдущий случай, когда фактическое увеличение скорости значительно превысило онлайн-оценки.