أصدر مشروع llama.cpp الإصدار b9862، والذي يتضمن تحسينًا للأداء لعملية gated_delta_net وتوفير ثنائيات جاهزة لـ macOS وLinux وWindows وAndroid وopenEuler.

  • يزيل النسخ الزائدة عن الحاجة من CUDA بعد gated_delta_net عن طريق اكتشاف نمط gated_delta_net -> view -> cpy.
  • يسمح لنواة CUDA GDN بكتابة لقطات الحالة مباشرةً إلى ذاكرة التخزين المؤقت المتكررة، متجاوزةً كتابات الذيل الوسيطة.
  • يعطل دعم KleidiAI لـ macOS Apple Silicon في هذا الإصدار.
  • يوفر ثنائيات لـ Ubuntu x64/arm64/s390x مع backends CPU وVulkan وROCm 7.2 وOpenVINO وSYCL.
  • يتضمن بناءات Windows لـ CPU وOpenCL Adreno وCUDA 12/13 وVulkan وOpenVINO وSYCL وHIP.

يحسّن هذا التحديث كفاءة الاستدلال على بنية وحدات معالجة الرسومات المدعومة مع الحفاظ على توافق واسع عبر أنظمة التشغيل المختلفة ومسرعات الأجهزة.