xAI ने Grok Voice पर प्रोडक्शन-ग्रेड वॉइस एजेंट्स को दो मिनट से कम समय में कॉन्फ़िगर करने के लिए डिज़ाइन किए गए एक कोड-रहित प्लेटफ़ॉर्म, Voice Agent Builder का बीटा रिलीज़ घोषित किया। यह टूल ऑपरेटरों और डेवलपर्स को बेसिक टेलीफोनी या AI स्टैक को शून्य से बनाने के बिना उच्च-वॉल्यूम वॉइस एजेंट्स को डिप्लॉय करने की अनुमति देता है।
- प्लेटफ़ॉर्म Grok Voice के साथ कसकर जुड़े स्पीच-टू-स्पीच पाथ का उपयोग करता है, अलग-अलग स्पीच-टू-टेक्स्ट, LLM और टेक्स्ट-टू-स्पीच API को जोड़ने की लेटेंसी और लागत से बचता है।
- उपयोगकर्ते साधारण भाषा के प्रॉम्प्ट्स के माध्यम से एजेंट्स को कॉन्फ़िगर कर सकते हैं, Markdown या Excel जैसे फॉर्मेट में ज्ञान आधार जोड़ सकते हैं, और Google Calendar, Linear या कस्टम API जैसे टूल्स से कनेक्ट कर सकते हैं।
- सुविधाओं में 80+ बिल्ट-इन वॉइसेज, दो मिनट के ऑडियो से वॉइस क्लोनिंग, रियल-टाइम नोटिफिकेशन, ट्रांसक्रिप्शन के साथ कॉल रिकॉर्डिंग और कॉन्फ़िगर करने योग्य गार्डरेल्स शामिल हैं।
- मूल्य निर्धारण को $0.05 प्रति मिनट ऑडियो के लिए एक API दर और प्रोविज़न किए गए नंबरों पर टेलीफोनी के लिए प्रति मिनट $0.01 तक सरल बना दिया गया है, जिससे अलग-अलग घटक शुल्क समाप्त हो जाते हैं।
लेखकों ने जोर देकर कहा कि सिस्टम शोर, बोलियों और विघ्न के साथ वास्तविक दुनिया की कॉल स्थितियों पर प्रशिक्षित है, पारंपरिक बहु-घटक वॉइस स्टैक्स की तुलना में एक पारदर्शी और सरल मूल्य निर्धारण मॉडल प्रदान करने का लक्ष्य रखता है।