قام مطوّر بنشر كود نواة استنتاج تعتمد على MLX مصممة لتشغيل نموذج Gemma 12B محلياً على عتاد المستهلك، مستهدفاً بشكل خاص أجهزة MacBook من سلسلة M.
يُبنى المشروع حول قيود جهاز MacBook Pro ذا السعة 16GB ويهدف إلى سد الفجوة بين مكتبات MLX ومكتبات CUDA لتطوير النماذج محلياً. يلاحظ المؤلف أنه رغم محاولة دمج DSpark، إلا أن متطلبات الذاكرة لنموذج المسودة تجاوزت عتبة 16GB، مما يشير إلى عمل مستقبلي على التكميم أو تدريب مسودة أصغر.
التركيز الحالي ينصب على إنهاء دمج الرسم البياني الأصلي والتحقق من صحة التنبؤ متعدد الرموز (MTP)، مع حدها النظوري للعبء على 20-30 رمزاً في الثانية بسبب قيود عرض نطاق الذاكرة. يُقدّم الكود كمورد تعليمي تجريبي بدلاً من كونه حلاً مُنتَجاً، رغم أن المؤلف يخطط لاستخدامه كنقطة انطلاق لتحسين نماذج Gemma على عتاد NVIDIA.