xAI telah mengumumkan rilis beta Voice Agent Builder, sebuah platform tanpa kode yang dirancang untuk mengonfigurasi agen suara tingkat produksi di Grok Voice dalam waktu kurang dari dua menit. Alat ini memungkinkan operator dan pengembang untuk mendeploy agen suara dengan volume tinggi tanpa membangun tumpukan telekomunikasi atau AI dasar dari awal.
- Platform ini menggunakan jalur speech-to-speech yang terikat erat dengan Grok Voice, menghindari latensi dan biaya dari penyambungan API terpisah untuk speech-to-text, LLM, dan text-to-speech.
- Pengguna dapat mengonfigurasi agen melalui prompt bahasa alami, melampirkan basis pengetahuan dalam format seperti Markdown atau Excel, dan menghubungkan alat seperti Google Calendar, Linear, atau API kustom.
- Fitur termasuk lebih dari 80 suara bawaan, kloning suara dari dua menit audio, notifikasi waktu nyata, rekaman panggilan dengan transkripsi, dan guardrail yang dapat dikonfigurasi.
- Harga disederhanakan menjadi tarif API sebesar $0,05 per menit audio ditambah $0,01 per menit untuk telekomunikasi pada nomor yang disediakan, menghilangkan biaya komponen terpisah.
Para penulis menekankan bahwa sistem ini dilatih dalam kondisi panggilan dunia nyata yang melibatkan kebisingan, aksen, dan interupsi, bertujuan untuk menyediakan model harga yang transparan dan sederhana dibandingkan dengan tumpukan suara multi-komponen tradisional.