Анди из Hugging Face выпустил полностью открытый и бесплатный демо-пример, создающий пайплайн голосового взаимодействия. Система интегрирует Nvidia parakeet, модель Gemma 4 31B, обслуживаемую Cerebras, и пользовательскую инференс-логику для Qwen3TTS.
- Стек работает как прямая замена realtime API от OpenAI.
- Он предназначен для просмотра и поиска в веб-сети с низкой задержкой.
- Поддерживается локальное выполнение, при этом на MacBook Pro M3 36GB с использованием Gemma 4 E4B достигается схожая задержка.
- Облачное веб-демо доступно по адресу hf-realtime-voice в Hugging Face Spaces.
Этот пайплайн позволяет пользователям запускать локальные голосовые взаимодействия и служит базовой технологией для Reachy Minis.