Kerangka kerja audio.cpp telah merilis ekspansi besar yang menambahkan kemampuan generasi musik, generasi SFX, dan pemisahan sumber menggunakan C++ dan GGML. Pembaruan ini mengintegrasikan beberapa model baru, termasuk ACE-Step 1.5 Turbo, HeartMuLa, Stable Audio 3 Small and Medium, Mel-Band RoFormer, dan HTDemucs.
- Rilis ini membawa cakupan kerangka kerja menjadi 21 dari 28 fitur yang direncanakan (75%).
- HeartMuLa sekarang dapat menghasilkan sekitar 10 menit audio dalam satu jalanan, menghapus batas pendek sebelumnya.
- ACE-Step Turbo menghasilkan 600 detik musik dalam 60.16 detik waktu dinding dengan faktor waktu nyata 0.100.
- Mode mem_saver tersedia untuk penggunaan jangka panjang guna mengurangi VRAM residensial setelah inferensi.
- HTDemucs tetap lebih lambat daripada jalur Python, dan jalanan hangat Stable Audio menunjukkan kinerja yang campur aduk.
Penulis mencatat bahwa rilis saat ini mengutamakan pembentukan jalur end-to-end dalam kerangka kerja bersama sebelum mengoptimalkan kinerja spesifik backend.