يقدم الباحثون Log_bQuant، وهو نهج كمية لوغاريتمية جديد يتميز بأساسات قابلة للتعديل مصممة للتكيف مع التوزيعات الشائعة للمعاملات في نماذج اللغة.

تعالج الطريقة التمثيلات دون المثلى الناتجة عن الأوزان ذات التردد المنخفض والمقدار العالي الموجودة في كتب الرموز للكمية الموحدة السابقة. تظهر أداءً متفوقًا بدقة 4-بت على عدة معايير مقارنة بالكمية الخطية غير المتناظرة على مستوى التنسور، مع تحقيق تسريع معتدل وتوفير كبير للذاكرة.

يجعل هذا النهج نماذج اللغة مناسبة للاستخدام الخاص على وحدات معالجة الرسومات من الفئة الاستهلاكية من خلال تقليل متطلبات الذاكرة وتحسين سرعة الاستدلال.