Пользователь Reddit поделился идеальным «списком желаний» и прогнозами относительно будущего локальных открытых больших языковых моделей, сославшись на свой положительный опыт работы с Qwen3.6-27B на потребительском оборудовании.
- Полное использование возможностей GPU благодаря диффузионным техникам в сочетании с разреженными архитектурами, такими как DSpark от DeepSeek V4.
- Улучшенные распределения Mixture of Experts (MOE) для динамического выбора знаний, что потенциально позволит выполнять прунинг без переобучения.
- Оптимизированные форматы данных и квантование для дальнейшего уменьшения размера модели и повышения эффективности.
- Механизмы идентификации и авторитета на уровне токенов для усиления защиты от инъекций промптов и улучшения управления контекстом.
Автор выражает воодушевление потенциалом открытых моделей для инноваций в области прозрачности и кастомизации по сравнению с закрытыми фронтенд-лабораториями.