audio.cpp 框架发布了一次重大扩展,使用 C++ 和 GGML 添加了音乐生成、SFX 生成和源分离功能。此更新集成了多个新模型,包括 ACE-Step 1.5 Turbo、HeartMuLa、Stable Audio 3 Small 和 Medium、Mel-Band RoFormer 和 HTDemucs。

  • 此次发布将框架的覆盖率提升至 28 项计划功能中的 21 项(75%)。
  • HeartMuLa 现在可以在单次运行中生成约 10 分钟的音频,消除了之前的短时限制。
  • ACE-Step Turbo 在 60.16 秒的实际时间内生成 600 秒的音乐,实时因子为 0.100。
  • 提供 mem_saver 模式用于长期运行,以减少推理后的驻留 VRAM。
  • HTDemucs 仍比 Python 路径慢,Stable Audio 预热运行的性能表现不一。

作者指出,当前发布优先在共享框架内建立端到端路径,然后再优化特定后端的性能。