SupraLabs 发布了 Supra-Router-51M,这是一款轻量级模型,旨在根据输入提示将用户请求路由到较小或较大的语言模型。该模型仅包含 5100 万个参数,使其能够在低延迟环境中有效运行。
此次发布包括模型权重和训练数据集 Prompt-Routing-Dataset,可在 Hugging Face 上获取。
该工具通过动态选择适合特定任务的模型,实现高效的请求编排。
SupraLabs 发布了 Supra-Router-51M,这是一款轻量级模型,旨在根据输入提示将用户请求路由到较小或较大的语言模型。该模型仅包含 5100 万个参数,使其能够在低延迟环境中有效运行。
此次发布包括模型权重和训练数据集 Prompt-Routing-Dataset,可在 Hugging Face 上获取。
该工具通过动态选择适合特定任务的模型,实现高效的请求编排。