USAF、推論のみ対応のGPUでMoEモデルのファインチューニングを可能に

著者は、推論のみに対応したハードウェア上でファインチューニングを可能にするために設計された、Mixture of Experts (MoE) モデル用の新しいスパースファインチューニング手法であるUSAFを紹介します。

このアプローチは、ファインチューニングに伴う通常の高ハードウェア要件を取り除くことで、MoEモデルのカスタマイズへのアクセスを民主化することを目指しています。