शोधकर्ताओं ने Log_bQuant पेश किया, जो एक नवीन लघुगणकीय क्वांटीकरण दृष्टिकोण है जिसमें समायोज्य आधार शामिल हैं जिन्हें भाषा मॉडल में सामान्य पैरामीटर वितरणों के अनुकूल बनाने के लिए डिज़ाइन किया गया है।
यह विधि पिछले एकसमान क्वांटीकरण कोडबुक्स में पाए गए कम-आवृत्ति उच्च-मैग्निट्यूड वजन के कारण होने वाले उप-अनुकूल प्रतिनिधित्वों को संबोधित करता है। यह टेंसर-स्तरीय ग्रैन्युलरिटी पर असममित रैखिक क्वांटीकरण की तुलना में कई बेंचमार्क्स पर 4-बिट सटीकता पर श्रेष्ठ प्रदर्शन दिखाता है, जबकि मध्यम गति वृद्धि और उच्च मेमोरी बचत प्राप्त करता है।
यह दृष्टिकोण मेमोरी आवश्यकताओं को कम करके और इनफरेंस गति को सुधारकर उपभोक्ता-ग्रेड GPUs पर निजी उपयोग के लिए भाषा मॉडल को उपयुक्त बनाता है।