Cerrando la brecha de calidad en texto-a-voz de bajo recurso: Ajuste fino con LoRA de VoxCPM2 para jemer y coreano
Los investigadores abordan la brecha de calidad en texto-a-voz de bajo recurso mediante el ajuste fino del modelo VoxCPM2 de 2.4B parámetros utilizando Adaptación de Bajo Rango (LoRA) en un corpus compartido de jemer y coreano.