Hugging Face 推出了一项新功能,允许用户通过 Hugging Face Jobs 平台使用单条命令直接部署 vLLM 服务器。

  • 该集成通过自动化基础设施设置简化了大语言模型的部署。
  • 用户可以在无需手动管理底层计算资源的情况下启动推理端点。
  • 这种方法降低了通常与扩展模型服务环境相关的复杂性。