أطلق أندى من هوجينج فيس ديمو مفتوح المصدر بالكامل ومجاني ينشئ خط أنابيب تفاعل صوتي. يدمج النظام parakeet الخاص بشركة Nvidia، ونموذج Gemma 4 31B الذي تقدمه Cerebras، واستدلال مخصص لـ Qwen3TTS.

  • تعمل هذه المجموعة كاستبدال مباشر لواجهة برمجة التطبيقات الزمنية الحقيقية من OpenAI.
  • تم تصميمها لرؤية الويب والبحث فيه بزمن استجابة منخفض.
  • يتم دعم التنفيذ المحلي، مع تحقيق أزمنة استجابة مماثلة على MacBook Pro M3 36GB باستخدام Gemma 4 E4B.
  • يتوفر ديمو ويب قائم على السحابة على hf-realtime-voice في مساحات Hugging Face.

يتيح هذا الخط الأنابيب للمستخدمين تشغيل تفاعلات صوتية محلية ويعمل كتقنية أساسية لـ Reachy Minis.