A xAI anunciou o lançamento beta do Voice Agent Builder, uma plataforma sem código projetada para configurar agentes de voz de nível de produção no Grok Voice em menos de dois minutos. Esta ferramenta permite que operadores e desenvolvedores implantem agentes de voz de alto volume sem construir a pilha de telefonia ou IA subjacente do zero.
- A plataforma usa um caminho de fala-para-fala fortemente acoplado ao Grok Voice, evitando a latência e o custo de costurar APIs separadas de fala-para-texto, LLM e texto-para-fala.
- Os usuários podem configurar agentes por meio de prompts em linguagem natural, anexar bases de conhecimento em formatos como Markdown ou Excel e conectar ferramentas como Google Calendar, Linear ou APIs personalizadas.
- As funcionalidades incluem mais de 80 vozes integradas, clonagem de voz a partir de dois minutos de áudio, notificações em tempo real, gravação de chamadas com transcrição e guardrails configuráveis.
- O preço é simplificado para uma taxa de API de $0,05 por minuto de áudio mais $0,01 por minuto para telefonia em números provisionados, eliminando taxas separadas de componentes.
Os autores enfatizam que o sistema foi treinado em condições reais de chamadas envolvendo ruído, sotaques e interrupções, visando fornecer um modelo de preços transparente e simples em comparação com pilhas de voz tradicionais de múltiplos componentes.