xAI 宣布了 Voice Agent Builder 的测试版发布,这是一个无代码平台,旨在在不到两分钟内配置 Grok Voice 上的生产级语音代理。该工具允许运营商和开发人员部署高容量语音代理,而无需从头构建底层电话或 AI 堆栈。

  • 该平台使用与 Grok Voice 紧密耦合的语音到语音路径,避免了拼接单独的语音转文本、LLM 和文本转语音 API 的延迟和成本。
  • 用户可以通过自然语言提示配置代理,附加 Markdown 或 Excel 等格式的知识库,并连接 Google Calendar、Linear 或自定义 API 等工具。
  • 功能包括 80 多种内置语音、两分钟音频的语音克隆、实时通知、带转录的通话录音以及可配置的护栏。
  • 定价简化为每分钟的 API 费率 $0.05 加上预配置号码的每分钟 $0.01 电话费,消除了单独的组件费用。

作者强调,该系统是在涉及噪音、口音和中断的真实世界通话条件下训练的,旨在与传统多组件语音堆栈相比提供透明且简单的定价模型。