يقدم المؤلف USAF، وهي طريقة جديدة لضبط الأوزان المتفرعة لنماذج مزيج الخبراء (MoE) مصممة للسماح بالضبط على الأجهزة القادرة فقط على الاستدلال.
- تدرب الطريقة أوزان الخبراء المتفرعة والموجه بدلاً من استخدام المحولات.
- تتيح ضبط Qwen3-30B-A3B على AMD RX 6750 XT مع 12 جيجابايت من ذاكرة الفيديو.
- المشروع مفتوح المصدر بموجب رخصة Apache 2.0.
تهدف هذه النهج إلى ديمقراطية الوصول إلى تخصيص نماذج MoE من خلال إزالة متطلبات الأجهزة العالية المرتبطة عادة بالضبط.