Spec-AUF अनुमानित डिकोडिंग में मास्क्ड ब्लॉक ड्राफ्टर्स के लिए एक प्रशिक्षण विधि पेश करता है जो क्रॉस-एंटरपी हानि को स्वीकृत प्राфик्स तक सीमित करके प्रशिक्षण उद्देश्य को इनफरेंस व्यवहार से संरेखित करता है। दृष्टिकोण ड्राफ्टर द्वारा पहले अनुमानित विफलता के माध्यम से ही हानि समर्थन को रखकर प्राфик्स-संवेदनशील निगरानी का अनुमान लगाता है, सहायक उद्देश्यों या इनफरेंस पाइपलाइन में परिवर्तन की आवश्यकता के बिना।

  • Qwen3-8B पर, AUF छह बेंचमार्क्स पर DFlash ड्राफ्टर के औसत उत्सर्जित लंबाई को 2.40 से बढ़ाकर 2.61 कर देता है।
  • विधि Domino की दो-शाखा वाली हेड में स्थानांतरित हो जाती है, प्रदर्शन को 2.56 से 2.68 तक सुधारती है।
  • मानक घातीय स्थिति-क्षय भारण एक बार जब AUF समर्थन को काट देता है तो व्यावहारिक रूप से निष्क्रिय हो जाता है।

यह परिवर्तन ड्राफ्ट स्वीकृति दरों को सुधारता है यह सुनिश्चित करके कि मॉडल केवल उन टोकन्स पर निगरानी करता है जो वास्तव में जनरेशन के दौरान प्रतिबद्ध किए जाते हैं।