USAF, 추론만 지원하는 GPU에서 MoE 모델 파인튜닝 가능하게 함

저자는 추론만 가능한 하드웨어에서 파인튜닝을 허용하도록 설계된 Mixture of Experts (MoE) 모델을 위한 새로운 희소 파인튜닝 방법인 USAF를 소개합니다.

이 접근 방식은 일반적으로 파인튜닝과 관련된 높은 하드웨어 요구 사항을 제거하여 MoE 모델 사용자 정의에 대한 접근을 민주화하는 것을 목표로 합니다.