El autor ha lanzado versiones web y de Python de las mejoras en los controles de voz de Kokoro, diseñadas para ser fácilmente porteadas a otros proyectos. Ambas implementaciones son completamente del lado del cliente, con la versión web logrando aproximadamente 40ms por generación cuando la aceleración por hardware está habilitada mediante WebGPU.
- El proyecto incluye tanto una interfaz web (kokoro-lab-web) como una biblioteca de Python (kokoro-lab-py).
- La página de GitHub carga el modelo Kokoro FP32 de 300MB directamente desde Hugging Face.
- Las mejoras se centran en controles de voz mejorados para abordar las limitaciones observadas en proyectos existentes de Kokoro.
Estas versiones mínimas se proporcionan para que los desarrolladores integren mecanismos de control mejorados en sus propias aplicaciones.