Usuario de Reddit busca consejo sobre backends multi-modelo e intercambio de configuración
Un usuario de Reddit está planeando desplegar una máquina con múltiples GPUs para servir modelos de codificación y Hermes, buscando soluciones que permitan un intercambio flexible de configuración sin intervención manual.