Пользователь на Reddit интересуется, является ли покупка двух видеокарт AMD Radeon RX 9060 XT с 16 ГБ VRAM каждая целесообразной инвестицией для запуска модели Qwen 3.6 27B и аналогичных архитектур.
Автор поста в настоящее время запускает модель на ноутбуке с процессором i7 и 64 ГБ ОЗУ, достигая примерно 3-4 токенов в секунду (tk/s) во время генерации и 50 tk/s во время префилла с использованием MTP.
Он описывает текущую скорость префилла как непригодную для его случая использования в качестве агента по написанию кода в большой кодовой базе, отмечая, что каждый вызов инструмента чтения требует ожидания 1-2 минуты до завершения префилла. Пользователь ищет ожидаемые показатели производительности для скоростей генерации и префилла на предложенной конфигурации с двумя RX 9060 XT, чтобы определить, решит ли это его проблемы с задержкой.