audio.cpp adiciona ACE-Step nativo C++/GGML, Stable Audio, HeartMuLa, RoFormer, HTDemucs

O framework audio.cpp lançou uma expansão maior adicionando capacidades de geração de música, geração de SFX e separação de fontes usando C++ e GGML. Esta atualização integra vários novos modelos, incluindo ACE-Step 1.5 Turbo, HeartMuLa, Stable Audio 3 Small e Medium, Mel-Band RoFormer e HTDemucs.

O lançamento leva a cobertura do framework para 21 das 28 funções planejadas (75%).
HeartMuLa agora pode gerar aproximadamente 10 minutos de áudio em uma única execução, removendo os limites curtos anteriores.
ACE-Step Turbo gera 600 segundos de música em 60.16 segundos de tempo real com um fator de tempo real de 0.100.
Há disponível um modo mem_saver para uso prolongado para reduzir a VRAM residente após a inferência.
HTDemucs permanece mais lento que o caminho Python, e as execuções de aquecimento do Stable Audio mostram desempenho misto.

O autor observa que o lançamento atual prioriza estabelecer caminhos de ponta a ponta dentro do framework compartilhado antes de otimizar o desempenho específico do backend.