Bro77XP는 초보자와 비프로그래머를 위해 설계된 100% 로컬 무료 AI VTuber 프로젝트를 출시했습니다. 이 시스템은 실시간 영어 음성 인식을 위해 Whisper를 사용하고, LLM 추론을 위해 llama3.2 모델이 있는 Ollama를 사용하며, 텍스트-음성 생성에는 Chatterbox TTS를 사용합니다. 즉시 제로샷 음성 복제 기능을 갖추고 있으며, 침묵을 자동으로 감지하여 발화가 있을 때만 녹음하는 지속적인 청취 루프에서 작동합니다. 소프트웨어는 VTube Studio의 API와 통합되어 생성된 응답에 따라 입 모양 표현을 제어하고 감정 애니메이션을 트리거합니다. 처음 AMD GPU에서 개발되었지만 코드는 주로 CPU 사용자를 지원하여 특정 NVIDIA 또는 AMD 하드웨어 없이도 작동할 수 있습니다. 설정에는 Python 3.10.11이 필요하며 openai-whisper, pyaudio, websocket-client와 같은 핵심 종속성을 설치하기 위해 가상 환경을 생성해야 합니다.