Log_bQuant समायोज्य आधारों के साथ लघुगणकीय क्वांटीकरण पेश करता है

शोधकर्ताओं ने Log_bQuant पेश किया, जो एक नवीन लघुगणकीय क्वांटीकरण दृष्टिकोण है जिसमें समायोज्य आधार शामिल हैं जिन्हें भाषा मॉडल में सामान्य पैरामीटर वितरणों के अनुकूल बनाने के लिए डिज़ाइन किया गया है।

यह विधि पिछले एकसमान क्वांटीकरण कोडबुक्स में पाए गए कम-आवृत्ति उच्च-मैग्निट्यूड वजन के कारण होने वाले उप-अनुकूल प्रतिनिधित्वों को संबोधित करता है। यह टेंसर-स्तरीय ग्रैन्युलरिटी पर असममित रैखिक क्वांटीकरण की तुलना में कई बेंचमार्क्स पर 4-बिट सटीकता पर श्रेष्ठ प्रदर्शन दिखाता है, जबकि मध्यम गति वृद्धि और उच्च मेमोरी बचत प्राप्त करता है।

यह दृष्टिकोण मेमोरी आवश्यकताओं को कम करके और इनफरेंस गति को सुधारकर उपभोक्ता-ग्रेड GPUs पर निजी उपयोग के लिए भाषा मॉडल को उपयुक्त बनाता है।