Andi do Hugging Face lançou uma demo totalmente open-source e gratuita que cria um pipeline de interação por voz. O sistema integra Nvidia parakeet, o modelo Gemma 4 31B servido pela Cerebras, e inferência personalizada para Qwen3TTS.

  • A pilha funciona como uma substituição direta para a API em tempo real da OpenAI.
  • É projetada para visualizar e pesquisar na web com baixa latência.
  • A execução local é suportada, alcançando latências semelhantes em um MacBook Pro M3 36GB usando Gemma 4 E4B.
  • Uma demo web baseada em nuvem está disponível em hf-realtime-voice no Hugging Face Spaces.

Este pipeline permite que os usuários executem interações de voz locais e serve como a tecnologia subjacente para o Reachy Minis.