El autor presenta USAF, un nuevo método de ajuste fino disperso para modelos Mixture of Experts (MoE) diseñado para permitir el ajuste fino en hardware capaz únicamente de inferencia.

  • El método entrena los pesos dispersos de los expertos y el enrutador en lugar de usar adaptadores.
  • Permite ajustar Qwen3-30B-A3B en una AMD RX 6750 XT con 12 GB de VRAM.
  • El proyecto es de código abierto bajo la licencia Apache 2.0.

Este enfoque busca democratizar el acceso a la personalización de modelos MoE eliminando los altos requisitos de hardware típicamente asociados con el ajuste fino.