audio.cpp फ्रेमवर्क ने C++ और GGML का उपयोग करके संगीत जनरेशन, SFX जनरेशन और स्रोत पृथक्करण क्षमताएं जोड़ते हुए एक प्रमुख विस्तार जारी किया है। इस अपडेट में ACE-Step 1.5 Turbo, HeartMuLa, Stable Audio 3 Small और Medium, Mel-Band RoFormer, और HTDemucs सहित कई नए मॉडल शामिल किए गए हैं।

  • रिलीज के साथ फ्रेमवर्क की कवरेज 28 में से 21 योजनाबद्ध सुविधाओं (75%) तक पहुंच गई है।
  • HeartMuLa अब एकल रन में लगभग 10 मिनट का ऑडियो जनरेट कर सकता है, जिससे पिछले छोटे समय के सीमाएं हट गई हैं।
  • ACE-Step Turbo 60.16 सेकंड की वास्तविक समय में 600 सेकंड का संगीत जनरेट करता है, जिसका रियल-टाइम फैक्टर 0.100 है।
  • लंबे समय तक उपयोग के लिए mem_saver मोड उपलब्ध है ताकि इनफरेंस के बाद रेजिडेंट VRAM कम हो सके।
  • HTDemucs Python पथ की तुलना में धीमा बना हुआ है, और Stable Audio वॉर्म रन मिश्रित प्रदर्शन दिखाते हैं।

लेखक ने नोट किया है कि वर्तमान रिलीज बैकएंड-विशिष्ट प्रदर्शन को अनुकूलित करने से पहले साझा फ्रेमवर्क के भीतर एंड-टू-एंड पथ स्थापित करने को प्राथमिकता देती है।