أصدرت Xenova أنوية WebGPU لـ Gemma 4، محققة أداءً يبلغ 255 توكن في الثانية. يتيح هذا التحسين تشغيل النماذج الكثيفة بسرعات تتجاوز 100 تيرابايت/ثانية في متصفحات الويب.

  • تستخدم التنفيذ تقنية WebGPU لتسريع الاستدلال.
  • يصل الأداء إلى 255 توكن/ثانية على نموذج Gemma 4.
  • يتوفر عرض تجريبي عبر مساحة Hugging Face التابعة لـ webml-community.

تتيح هذه السرعة للنماذج المحلية الخاصة معالجة معظم المهام، مما يقلل الاعتماد على واجهات برمجة التطبيقات المتقدمة مثل Claude أو Codex للعمل اليومي.