Оценка TTS без использования CPU сравнивает Kokoro-82M, Supertonic-3 и Inflect-Nano-v1 на процессоре Intel Xeon с 4 ядрами и 15,6 ГБ ОЗУ. Kokoro обеспечивает наиболее естественный звук (MOS 4,44-4,45), несмотря на более медленную скорость, при этом версия ONNX превосходит версию PyTorch по показателю реального времени, сохраняя идентичное качество. Supertonic-5-step достигает сбалансированного результата при скорости 3,2x и MOS 4,37, что делает его наиболее практичным выбором с точки зрения удобства использования и качества.