El framework audio.cpp ha lanzado una expansión mayor que añade capacidades de generación de música, generación de SFX y separación de fuentes utilizando C++ y GGML. Esta actualización integra varios modelos nuevos, incluyendo ACE-Step 1.5 Turbo, HeartMuLa, Stable Audio 3 Small y Medium, Mel-Band RoFormer y HTDemucs.

  • El lanzamiento lleva la cobertura del framework a 21 de cada 28 funciones planificadas (75%).
  • HeartMuLa ahora puede generar aproximadamente 10 minutos de audio en una sola ejecución, eliminando los límites cortos anteriores.
  • ACE-Step Turbo genera 600 segundos de música en 60.16 segundos de tiempo real con un factor de tiempo real de 0.100.
  • Hay disponible un modo mem_saver para uso prolongado para reducir la VRAM residente después de la inferencia.
  • HTDemucs sigue siendo más lento que la ruta Python, y las ejecuciones de calentamiento de Stable Audio muestran un rendimiento mixto.

El autor señala que el lanzamiento actual prioriza establecer rutas de extremo a extremo dentro del framework compartido antes de optimizar el rendimiento específico del backend.