Andi dari Hugging Face telah merilis demo sepenuhnya open-source dan gratis yang membuat pipeline interaksi suara. Sistem ini mengintegrasikan parakeet Nvidia, model Gemma 4 31B yang di-servis oleh Cerebras, dan inferensi khusus untuk Qwen3TTS.

  • Tumpukan ini berfungsi sebagai pengganti langsung untuk API realtime OpenAI.
  • Dirancang untuk melihat dan mencari web dengan latensi rendah.
  • Eksekusi lokal didukung, dengan latensi serupa dicapai pada MacBook Pro M3 36GB menggunakan Gemma 4 E4B.
  • Demo web berbasis cloud tersedia di hf-realtime-voice di Hugging Face Spaces.

Pipeline ini memungkinkan pengguna menjalankan interaksi suara lokal dan berfungsi sebagai teknologi dasar untuk Reachy Minis.