أصدرت Xenova أنوية WebGPU لـ Gemma 4، محققة أداءً يبلغ 255 توكن في الثانية. يتيح هذا التحسين تشغيل النماذج الكثيفة بسرعات تتجاوز 100 تيرابايت/ثانية في متصفحات الويب.
- تستخدم التنفيذ تقنية WebGPU لتسريع الاستدلال.
- يصل الأداء إلى 255 توكن/ثانية على نموذج Gemma 4.
- يتوفر عرض تجريبي عبر مساحة Hugging Face التابعة لـ webml-community.
تتيح هذه السرعة للنماذج المحلية الخاصة معالجة معظم المهام، مما يقلل الاعتماد على واجهات برمجة التطبيقات المتقدمة مثل Claude أو Codex للعمل اليومي.