xAI объявила о бета-версии Voice Agent Builder, платформы без кода, предназначенной для настройки голосовых агентов производственного уровня в Grok Voice за две минуты. Этот инструмент позволяет операторам и разработчикам развертывать высоконагруженные голосовые агенты без создания с нуля базовой телекоммуникационной или ИИ-инфраструктуры.

  • Платформа использует путь «речь-в-речь», тесно интегрированный с Grok Voice, избегая задержек и затрат на соединение отдельных API для распознавания речи, LLM и синтеза речи.
  • Пользователи могут настраивать агентов с помощью текстовых запросов, подключать базы знаний в форматах Markdown или Excel, а также интегрировать инструменты, такие как Google Calendar, Linear или пользовательские API.
  • Включает более 80 встроенных голосов, клонирование голоса по двум минутам аудио, уведомления в реальном времени, запись звонков с транскрипцией и настраиваемые защитные механизмы.
  • Ценообразование упрощено до тарифа API $0.05 за минуту аудио плюс $0.01 за минуту телекоммуникационных услуг для выделенных номеров, устраняя отдельные компоненты затрат.

Авторы подчеркивают, что система обучена на реальных условиях звонков с шумом, акцентами и прерываниями, стремясь обеспечить прозрачную и простую модель ценообразования по сравнению с традиционными многокомпонентными голосовыми стеками.