Seorang pengguna mencari rekomendasi untuk model coding terbaik yang akan dijalankan pada setup perangkat keras khusus yang terdiri dari tiga unit Asus Ascent GX10 (GB10), dengan ekspektasi konkurensi 5-10 pengguna.

  • Infrastruktur yang diusulkan menggunakan vLLM yang dikombinasikan dengan llama-swap.
  • Model potensial yang sedang dipertimbangkan termasuk Qwen 3.5 122B, Qwen 3-coder, dan Deepseek V4 Flash DSpark.
  • Pengguna menanyakan tentang skalasi ruang konteks yang diperlukan per pengguna dan apakah tiga unit Spark optimal untuk konfigurasi ini.