Seorang pengguna Reddit melaporkan telah memilih versi unsloth dari model Qwen 3.5 122b-a10b (UD-IQ4_NL) untuk tugas coding dengan VRAM 64GB.
- Model ini memiliki jendela konteks bf16 100k dan berjalan pada kecepatan sekitar 30 token per detik.
- Hanya beberapa lapisan yang dimuat ke CPU/RAM untuk mengakomodasi batasan perangkat keras.
- Pengguna tersebut juga memanfaatkan model Qwen 3.6 tergantung pada kebutuhan spesifik, tetapi menganggap varian 122b-a10b sebagai penggerak harian utamanya.