Un utilisateur de Reddit partage une "liste de souhaits" idéale et des prédictions pour l'avenir des grands modèles de langage (LLM) open-source locaux, citant son expérience positive avec l'exécution de Qwen3.6-27B sur du matériel grand public.

  • Débloquer une utilisation complète du GPU grâce à des techniques basées sur la diffusion combinées à des architectures éparses comme le DSpark de DeepSeek V4.
  • Des distributions Mixture of Experts (MOE) améliorées pour permettre une sélection dynamique des connaissances, permettant potentiellement l'élagage sans réentraînement.
  • Des dispositions de données et des formats de quantification optimisés pour réduire davantage la taille du modèle et améliorer l'efficacité.
  • Des mécanismes d'identité et d'autorité au niveau des tokens pour renforcer la sécurité contre les injections de prompts et améliorer la gestion du contexte.

L'auteur exprime son enthousiasme face au potentiel des modèles open-source à innover en matière de transparence et de personnalisation par rapport aux laboratoires de pointe fermés.