Seorang pengguna Reddit membagikan "daftar keinginan" ideal dan prediksi untuk masa depan model bahasa besar (LLM) open-source lokal, dengan merujuk pada pengalaman positifnya menjalankan Qwen3.6-27B di perangkat keras konsumen.

  • Memaksimalkan pemanfaatan GPU penuh melalui teknik berbasis difusi yang dikombinasikan dengan arsitektur sparse seperti DSpark dari DeepSeek V4.
  • Distribusi Mixture of Experts (MOE) yang ditingkatkan untuk memungkinkan pemilihan pengetahuan secara dinamis, berpotensi memungkinkan pruning tanpa pelatihan ulang.
  • Tata letak data dan format kuantisasi yang dioptimalkan untuk lebih mengurangi ukuran model dan meningkatkan efisiensi.
  • Mekanisme identitas dan otoritas tingkat token untuk meningkatkan keamanan terhadap injeksi prompt dan memperbaiki manajemen konteks.

Penulis menyatakan kegembiraan atas potensi model open-source untuk berinovasi dalam hal transparansi dan kustomisasi dibandingkan dengan lab frontier tertutup.