xAI ha anunciado la versión beta de Voice Agent Builder, una plataforma sin código diseñada para configurar agentes de voz de nivel de producción en Grok Voice en menos de dos minutos. Esta herramienta permite a operadores y desarrolladores desplegar agentes de voz de alto volumen sin construir desde cero la infraestructura de telefonía o IA subyacente.
- La plataforma utiliza un camino de voz a voz estrechamente acoplado con Grok Voice, evitando la latencia y el costo de unir APIs separadas de voz a texto, LLM y texto a voz.
- Los usuarios pueden configurar agentes mediante prompts en lenguaje natural, adjuntar bases de conocimiento en formatos como Markdown o Excel, y conectar herramientas como Google Calendar, Linear o APIs personalizadas.
- Las características incluyen más de 80 voces integradas, clonación de voz desde dos minutos de audio, notificaciones en tiempo real, grabación de llamadas con transcripción y barreras configurables.
- La tarifa se simplifica a una tasa de API de $0.05 por minuto de audio más $0.01 por minuto por telefonía en números provisionados, eliminando tarifas separadas por componentes.
Los autores enfatizan que el sistema está entrenado en condiciones de llamadas del mundo real que involucran ruido, acentos e interrupciones, con el objetivo de proporcionar un modelo de precios transparente y simple en comparación con las pilas de voz tradicionales de múltiples componentes.