あるRedditユーザーは、64GBのVRAMを持つコーディングタスクのためにQwen 3.5 122b-a10bモデル(UD-IQ4_NL)のunsloth版を採用したと報告しています。
- このモデルは100k bf16コンテキストウィンドウを備え、約30トークン/秒で動作します。
- ハードウェアの制約に対応するため、CPU/RAMには数層のみが読み込まれます。
- ユーザーは特定のニーズに応じてQwen 3.6モデルも利用していますが、122b-a10bバリアントを日常的なメインモデルと位置づけています。