xAI a annoncé la version bêta de Voice Agent Builder, une plateforme sans code conçue pour configurer des agents vocaux de niveau production sur Grok Voice en moins de deux minutes. Cet outil permet aux opérateurs et développeurs de déployer des agents vocaux à fort volume sans avoir à construire la pile télécom ou IA sous-jacente à partir de zéro.

  • La plateforme utilise un chemin parole-parole étroitement couplé avec Grok Voice, évitant ainsi la latence et le coût liés au raccordement d'API distinctes de reconnaissance vocale (STT), de LLM et de synthèse vocale (TTS).
  • Les utilisateurs peuvent configurer les agents via des invites en langage naturel, attacher des bases de connaissances au format Markdown ou Excel, et connecter des outils tels que Google Calendar, Linear ou des API personnalisées.
  • Les fonctionnalités incluent plus de 80 voix intégrées, le clonage vocal à partir de deux minutes d'audio, des notifications en temps réel, l'enregistrement d'appels avec transcription, et des garde-fous configurables.
  • La tarification est simplifiée à un tarif API de 0,05 $ par minute d'audio plus 0,01 $ par minute pour la téléphonie sur les numéros provisionnés, éliminant les frais séparés pour chaque composant.

Les auteurs soulignent que le système est entraîné dans des conditions d'appels réels impliquant du bruit, des accents et des interruptions, visant à offrir un modèle de tarification transparent et simple par rapport aux piles vocales traditionnelles à multiples composants.