L'auteur présente USAF, une nouvelle méthode de fine-tuning éparse pour les modèles Mixture of Experts (MoE), conçue pour permettre le fine-tuning sur du matériel capable uniquement d'inférence.
- La méthode entraîne les poids des experts épars et le routeur au lieu d'utiliser des adaptateurs.
- Elle permet le fine-tuning de Qwen3-30B-A3B sur un AMD RX 6750 XT avec 12 Go de VRAM.
- Le projet est open source sous licence Apache 2.0.
Cette approche vise à démocratiser l'accès à la personnalisation des modèles MoE en supprimant les exigences matérielles élevées généralement associées au fine-tuning.