SupraLabs ha lanzado Supra-Router-51M, un modelo ligero diseñado para enrutar las solicitudes de los usuarios a modelos de lenguaje más pequeños o más grandes según el prompt de entrada. El modelo contiene solo 51 millones de parámetros, lo que le permite operar eficazmente en entornos de baja latencia.
El lanzamiento incluye los pesos del modelo y el conjunto de datos de entrenamiento Prompt-Routing-Dataset, disponibles en Hugging Face.
Esta herramienta permite una orquestación eficiente de solicitudes mediante la selección dinámica de modelos apropiados para tareas específicas.