Seorang pengguna Reddit melaporkan telah memilih versi unsloth dari model Qwen 3.5 122b-a10b (UD-IQ4_NL) untuk tugas coding dengan VRAM 64GB.

  • Model ini memiliki jendela konteks bf16 100k dan berjalan pada kecepatan sekitar 30 token per detik.
  • Hanya beberapa lapisan yang dimuat ke CPU/RAM untuk mengakomodasi batasan perangkat keras.
  • Pengguna tersebut juga memanfaatkan model Qwen 3.6 tergantung pada kebutuhan spesifik, tetapi menganggap varian 122b-a10b sebagai penggerak harian utamanya.