Seorang pengguna Reddit membagikan "daftar keinginan" ideal dan prediksi untuk masa depan model bahasa besar (LLM) open-source lokal, dengan merujuk pada pengalaman positifnya menjalankan Qwen3.6-27B di perangkat keras konsumen.
- Memaksimalkan pemanfaatan GPU penuh melalui teknik berbasis difusi yang dikombinasikan dengan arsitektur sparse seperti DSpark dari DeepSeek V4.
- Distribusi Mixture of Experts (MOE) yang ditingkatkan untuk memungkinkan pemilihan pengetahuan secara dinamis, berpotensi memungkinkan pruning tanpa pelatihan ulang.
- Tata letak data dan format kuantisasi yang dioptimalkan untuk lebih mengurangi ukuran model dan meningkatkan efisiensi.
- Mekanisme identitas dan otoritas tingkat token untuk meningkatkan keamanan terhadap injeksi prompt dan memperbaiki manajemen konteks.
Penulis menyatakan kegembiraan atas potensi model open-source untuk berinovasi dalam hal transparansi dan kustomisasi dibandingkan dengan lab frontier tertutup.