Andi dari Hugging Face telah merilis demo sepenuhnya open-source dan gratis yang membuat pipeline interaksi suara. Sistem ini mengintegrasikan parakeet Nvidia, model Gemma 4 31B yang di-servis oleh Cerebras, dan inferensi khusus untuk Qwen3TTS.
- Tumpukan ini berfungsi sebagai pengganti langsung untuk API realtime OpenAI.
- Dirancang untuk melihat dan mencari web dengan latensi rendah.
- Eksekusi lokal didukung, dengan latensi serupa dicapai pada MacBook Pro M3 36GB menggunakan Gemma 4 E4B.
- Demo web berbasis cloud tersedia di hf-realtime-voice di Hugging Face Spaces.
Pipeline ini memungkinkan pengguna menjalankan interaksi suara lokal dan berfungsi sebagai teknologi dasar untuk Reachy Minis.