أطلق أندى من هوجينج فيس ديمو مفتوح المصدر بالكامل ومجاني ينشئ خط أنابيب تفاعل صوتي. يدمج النظام parakeet الخاص بشركة Nvidia، ونموذج Gemma 4 31B الذي تقدمه Cerebras، واستدلال مخصص لـ Qwen3TTS.
- تعمل هذه المجموعة كاستبدال مباشر لواجهة برمجة التطبيقات الزمنية الحقيقية من OpenAI.
- تم تصميمها لرؤية الويب والبحث فيه بزمن استجابة منخفض.
- يتم دعم التنفيذ المحلي، مع تحقيق أزمنة استجابة مماثلة على MacBook Pro M3 36GB باستخدام Gemma 4 E4B.
- يتوفر ديمو ويب قائم على السحابة على hf-realtime-voice في مساحات Hugging Face.
يتيح هذا الخط الأنابيب للمستخدمين تشغيل تفاعلات صوتية محلية ويعمل كتقنية أساسية لـ Reachy Minis.