أطلق إطار عمل audio.cpp توسعة رئيسية تضيف قدرات توليد الموسيقى، وتوليد المؤثرات الصوتية (SFX)، وفصل المصادر باستخدام C++ وGGML. يدمج هذا التحديث عدة نماذج جديدة، بما في ذلك ACE-Step 1.5 Turbo، وHeartMuLa، وStable Audio 3 Small and Medium، وMel-Band RoFormer، وHTDemucs.

  • يجلب الإصدار تغطية الإطار إلى 21 من أصل 28 ميزة مخططة (75%).
  • يمكن لـ HeartMuLa الآن توليد حوالي 10 دقائق من الصوت في تشغيل واحد، مما يزيل الحدود القصيرة السابقة.
  • يولد ACE-Step Turbo 600 ثانية من الموسيقى في 60.16 ثانية من الوقت الفعلي بعامل زمني حقيقي يبلغ 0.100.
  • يتوفر وضع mem_saver للاستخدام طويل الأمد لتقليل VRAM المقيم بعد الاستدلال.
  • يظل HTDemucs أبطأ من المسار الخاص بـ Python، وتظهر عمليات التشغيل الدافئة لـ Stable Audio أداءً مختلطًا.

يلاحظ المؤلف أن الإصدار الحالي يعطي الأولوية لتأسيس مسارات من البداية إلى النهاية داخل الإطار المشترك قبل تحسين الأداء المحدد للخلفية.