أصدر مشروع llama.cpp الإصدار b9862، والذي يتضمن تحسينًا للأداء لعملية gated_delta_net وتوفير ثنائيات جاهزة لـ macOS وLinux وWindows وAndroid وopenEuler.
- يزيل النسخ الزائدة عن الحاجة من CUDA بعد gated_delta_net عن طريق اكتشاف نمط gated_delta_net -> view -> cpy.
- يسمح لنواة CUDA GDN بكتابة لقطات الحالة مباشرةً إلى ذاكرة التخزين المؤقت المتكررة، متجاوزةً كتابات الذيل الوسيطة.
- يعطل دعم KleidiAI لـ macOS Apple Silicon في هذا الإصدار.
- يوفر ثنائيات لـ Ubuntu x64/arm64/s390x مع backends CPU وVulkan وROCm 7.2 وOpenVINO وSYCL.
- يتضمن بناءات Windows لـ CPU وOpenCL Adreno وCUDA 12/13 وVulkan وOpenVINO وSYCL وHIP.
يحسّن هذا التحديث كفاءة الاستدلال على بنية وحدات معالجة الرسومات المدعومة مع الحفاظ على توافق واسع عبر أنظمة التشغيل المختلفة ومسرعات الأجهزة.