Hugging Face 和 Cerebras 已将 Google 的 Gemma 4 模型集成到其平台中,以支持实时语音人工智能应用。此次合作使开发人员能够利用 Gemma 4 的多模态能力进行低延迟音频处理任务。

  • 该合作伙伴关系结合了 Hugging Face 的软件基础设施与 Cerebras 的 Wafer-Scale Engine 硬件。
  • Google 的 Gemma 4 模型用于实时处理和生成语音数据。
  • 该集成支持多模态 AI 工作流,能够同时处理文本和音频输入。

这一发展为开发人员提供了构建响应式语音应用所需的工具,通过专用硬件加速降低了推理延迟。