Un usuario de Reddit busca recomendaciones para un modelo de lenguaje grande local capaz de generar diseños de software de alto y bajo nivel. El flujo de trabajo implica usar plantillas existentes, cruzar referencias con el código e integrarse con marcos agénticos como OpenCode a través de MCP para obtener datos de Confluence y Jira. El usuario actualmente depende de Opus 3.6 a través de Kiro-cli pero requiere una solución que garantice la privacidad de los datos. Las restricciones técnicas clave incluyen la necesidad de al menos 256k de longitud de contexto y fuertes capacidades de razonamiento. El autor pregunta si es necesario hardware como cuatro GPUs RTX 3090 para lograr este nivel de rendimiento localmente.