El framework audio.cpp ha lanzado una expansión mayor que añade capacidades de generación de música, generación de SFX y separación de fuentes utilizando C++ y GGML. Esta actualización integra varios modelos nuevos, incluyendo ACE-Step 1.5 Turbo, HeartMuLa, Stable Audio 3 Small y Medium, Mel-Band RoFormer y HTDemucs.
- El lanzamiento lleva la cobertura del framework a 21 de cada 28 funciones planificadas (75%).
- HeartMuLa ahora puede generar aproximadamente 10 minutos de audio en una sola ejecución, eliminando los límites cortos anteriores.
- ACE-Step Turbo genera 600 segundos de música en 60.16 segundos de tiempo real con un factor de tiempo real de 0.100.
- Hay disponible un modo mem_saver para uso prolongado para reducir la VRAM residente después de la inferencia.
- HTDemucs sigue siendo más lento que la ruta Python, y las ejecuciones de calentamiento de Stable Audio muestran un rendimiento mixto.
El autor señala que el lanzamiento actual prioriza establecer rutas de extremo a extremo dentro del framework compartido antes de optimizar el rendimiento específico del backend.