Автор выпустил веб- и Python-версии улучшений голосовых настроек Kokoro, предназначенные для легкой интеграции в другие проекты. Обе реализации полностью работают на стороне клиента; при включении аппаратного ускорения через WebGPU веб-версия обеспечивает время генерации около 40 мс.

  • Проект включает как веб-интерфейс (kokoro-lab-web), так и Python-библиотеку (kokoro-lab-py).
  • На странице GitHub модель Kokoro FP32 объемом 300 МБ загружается напрямую с Hugging Face.
  • Улучшения сосредоточены на улучшении голосовых настроек для устранения ограничений, наблюдаемых в существующих проектах Kokoro.

Эти минималистичные версии предоставлены разработчикам для интеграции улучшенных механизмов управления в их собственные приложения.