Пользователь Reddit изложил пожелания для будущих локальных открытых LLM

Пользователь Reddit поделился идеальным «списком желаний» и прогнозами относительно будущего локальных открытых больших языковых моделей, сославшись на свой положительный опыт работы с Qwen3.6-27B на потребительском оборудовании.

Полное использование возможностей GPU благодаря диффузионным техникам в сочетании с разреженными архитектурами, такими как DSpark от DeepSeek V4.
Улучшенные распределения Mixture of Experts (MOE) для динамического выбора знаний, что потенциально позволит выполнять прунинг без переобучения.
Оптимизированные форматы данных и квантование для дальнейшего уменьшения размера модели и повышения эффективности.
Механизмы идентификации и авторитета на уровне токенов для усиления защиты от инъекций промптов и улучшения управления контекстом.

Автор выражает воодушевление потенциалом открытых моделей для инноваций в области прозрачности и кастомизации по сравнению с закрытыми фронтенд-лабораториями.