USAF permite o ajuste fino de modelos MoE em GPUs que suportam apenas inferência

O autor apresenta o USAF, um novo método de ajuste fino esparso para modelos Mixture of Experts (MoE) projetado para permitir o ajuste fino em hardware capaz apenas de inferência.

O método treina os pesos esparsos dos especialistas e o roteador em vez de usar adaptadores.
Permite ajustar o Qwen3-30B-A3B em uma AMD RX 6750 XT com 12 GB de VRAM.
O projeto é de código aberto sob a licença Apache 2.0.

Esta abordagem visa democratizar o acesso à personalização de modelos MoE, removendo os altos requisitos de hardware tipicamente associados ao ajuste fino.