Seorang pengguna mencari rekomendasi untuk model coding terbaik yang akan dijalankan pada setup perangkat keras khusus yang terdiri dari tiga unit Asus Ascent GX10 (GB10), dengan ekspektasi konkurensi 5-10 pengguna.
- Infrastruktur yang diusulkan menggunakan vLLM yang dikombinasikan dengan llama-swap.
- Model potensial yang sedang dipertimbangkan termasuk Qwen 3.5 122B, Qwen 3-coder, dan Deepseek V4 Flash DSpark.
- Pengguna menanyakan tentang skalasi ruang konteks yang diperlukan per pengguna dan apakah tiga unit Spark optimal untuk konfigurasi ini.