audio.cpp ajoute ACE-Step, Stable Audio, HeartMuLa, RoFormer, HTDemucs natifs C++/GGML

Le framework audio.cpp a publié une extension majeure ajoutant la génération de musique, la génération de SFX et les capacités de séparation de source en utilisant C++ et GGML. Cette mise à jour intègre plusieurs nouveaux modèles, dont ACE-Step 1.5 Turbo, HeartMuLa, Stable Audio 3 Small and Medium, Mel-Band RoFormer et HTDemucs.

La release porte la couverture du framework à 21 sur 28 fonctionnalités prévues (75%).
HeartMuLa peut désormais générer environ 10 minutes d'audio en une seule exécution, supprimant les limites précédentes de courte durée.
ACE-Step Turbo génère 600 secondes de musique en 60.16 secondes de temps réel avec un facteur temps réel de 0.100.
Un mode mem_saver est disponible pour une utilisation de longue durée afin de réduire la VRAM résidente après l'inférence.
HTDemucs reste plus lent que le chemin Python, et les exécutions à chaud de Stable Audio montrent des performances mitigées.

L'auteur note que la release actuelle privilégie l'établissement de chemins de bout en bout au sein du framework partagé avant d'optimiser les performances spécifiques au backend.