audio.cppフレームワークは、C++とGGMLを使用して音楽生成、SFX生成、およびソース分離機能を加える大規模な拡張をリリースしました。このアップデートでは、ACE-Step 1.5 Turbo、HeartMuLa、Stable Audio 3 Small and Medium、Mel-Band RoFormer、HTDemucsなど、いくつかの新しいモデルが統合されています。
- 今回のリリースにより、フレームワークのカバレッジは計画された28機能のうち21(75%)になりました。
- HeartMuLaは現在、単一の実行で約10分間のオーディオを生成可能になり、以前の短い制限が撤廃されました。
- ACE-Step Turboは、60.16秒のウォールタイムで600秒分の音楽を生成し、リアルタイムファクターは0.100です。
- 長期利用のためにmem_saverモードが利用可能になり、推論後に残留VRAMを削減できます。
- HTDemucsはPythonパスよりも遅く、Stable Audioのウォームアップ実行はパフォーマンスにばらつきがあります。
著者は、現在のリリースがバックエンド固有のパフォーマンスを最適化する前に、共有フレームワーク内でのエンドツーエンドの経路確立を優先していると述べています。