Анди из Hugging Face выпустил полностью открытый и бесплатный демо-пример, создающий пайплайн голосового взаимодействия. Система интегрирует Nvidia parakeet, модель Gemma 4 31B, обслуживаемую Cerebras, и пользовательскую инференс-логику для Qwen3TTS.

  • Стек работает как прямая замена realtime API от OpenAI.
  • Он предназначен для просмотра и поиска в веб-сети с низкой задержкой.
  • Поддерживается локальное выполнение, при этом на MacBook Pro M3 36GB с использованием Gemma 4 E4B достигается схожая задержка.
  • Облачное веб-демо доступно по адресу hf-realtime-voice в Hugging Face Spaces.

Этот пайплайн позволяет пользователям запускать локальные голосовые взаимодействия и служит базовой технологией для Reachy Minis.