Hugging Face से Andi ने एक पूरी तरह से ओपन-सोर्स और मुफ्त-उपयोग वाली डेमो जारी की है जो एक वॉइस इंटरैक्शन पाइपलाइन बनाती है। सिस्टम Nvidia parakeet, Cerebras द्वारा संचालित Gemma 4 31B मॉडल, और Qwen3TTS के लिए कस्टम इनफरेंस को एकीकृत करता है।
- स्टैक OpenAI के realtime API के लिए एक ड्रॉप-इन प्रतिस्थापन के रूप में कार्य करता है।
- यह कम लेटेंसी के साथ वेब देखने और खोजने के लिए डिज़ाइन किया गया है।
- स्थानीय निष्पादन का समर्थन किया जाता है, Gemma 4 E4B का उपयोग करते हुए MacBook Pro M3 36GB पर समान लेटेंसी प्राप्त की गई है।
- hf-realtime-voice पर Hugging Face Spaces में एक क्लाउड-आधारित वेब डेमो उपलब्ध है।
यह पाइपलाइन उपयोगकर्ताओं को स्थानीय वॉइस इंटरैक्शन चलाने की अनुमति देती है और Reachy Minis के लिए अंतर्निहित तकनीक के रूप में कार्य करती है।