来自 Hugging Face 的 Andi 发布了一个完全开源且免费使用的演示,用于创建语音交互管道。该系统集成了 Nvidia parakeet、由 Cerebras 提供的 Gemma 4 31B 模型以及针对 Qwen3TTS 的自定义推理。
- 该堆栈可作为 OpenAI realtime API 的直接替代品。
- 它旨在以低延迟查看和搜索网络。
- 支持本地执行,在配备 Gemma 4 E4B 的 MacBook Pro M3 36GB 上实现了类似的延迟。
- 云端 Web 演示可在 Hugging Face Spaces 上的 hf-realtime-voice 处获取。
该管道使用户能够运行本地语音交互,并作为 Reachy Minis 的基础技术。