Пользователь Reddit ищет рекомендации по самой большой модели с возможностями рассуждений, которая помещается в лимит 64 ГБ VRAM для целей дистилляции знаний.
- У пользователя две видеокарты R9700, обеспечивающие суммарно 64 ГБ VRAM.
- Они готовы принять более низкую скорость инференса, например, 12 токенов в секунду.
- Модель с 72 миллиардами параметров определена как подходящая под их аппаратные ограничения.