يقدم المؤلف USAF، وهي طريقة جديدة لضبط الأوزان المتفرعة لنماذج مزيج الخبراء (MoE) مصممة للسماح بالضبط على الأجهزة القادرة فقط على الاستدلال.

  • تدرب الطريقة أوزان الخبراء المتفرعة والموجه بدلاً من استخدام المحولات.
  • تتيح ضبط Qwen3-30B-A3B على AMD RX 6750 XT مع 12 جيجابايت من ذاكرة الفيديو.
  • المشروع مفتوح المصدر بموجب رخصة Apache 2.0.

تهدف هذه النهج إلى ديمقراطية الوصول إلى تخصيص نماذج MoE من خلال إزالة متطلبات الأجهزة العالية المرتبطة عادة بالضبط.