Un usuario de Reddit comparte una "lista de deseos" ideal y predicciones sobre el futuro de los grandes modelos de lenguaje (LLM) locales de código abierto, citando su experiencia positiva ejecutando Qwen3.6-27B en hardware de consumo.
- Desbloquear el uso completo de la GPU mediante técnicas basadas en difusión combinadas con arquitecturas dispersas como DSpark de DeepSeek V4.
- Mejoras en las distribuciones de Mezcla de Expertos (MOE) para permitir la selección dinámica de conocimientos, posibilitando potencialmente la poda sin reentrenamiento.
- Diseños de datos optimizados y formatos de cuantización para reducir aún más el tamaño del modelo y mejorar la eficiencia.
- Mecanismos de identidad y autoridad a nivel de token para mejorar la seguridad contra inyección de prompts y gestionar mejor el contexto.
El autor expresa entusiasmo por el potencial de los modelos de código abierto para innovar en transparencia y personalización en comparación con los laboratorios de vanguardia de código cerrado.