Usuario de Reddit busca LLM local privado para documentación técnica

Un usuario de Reddit busca recomendaciones para un modelo de lenguaje grande local capaz de generar diseños de software de alto y bajo nivel. El flujo de trabajo implica usar plantillas existentes, cruzar referencias con el código e integrarse con marcos agénticos como OpenCode a través de MCP para obtener datos de Confluence y Jira. El usuario actualmente depende de Opus 3.6 a través de Kiro-cli pero requiere una solución que garantice la privacidad de los datos. Las restricciones técnicas clave incluyen la necesidad de al menos 256k de longitud de contexto y fuertes capacidades de razonamiento. El autor pregunta si es necesario hardware como cuatro GPUs RTX 3090 para lograr este nivel de rendimiento localmente.