إصدار llama.cpp b9862: تحسين CUDA وثنائيات متعددة المنصات

أصدر مشروع llama.cpp الإصدار b9862، والذي يتضمن تحسينًا للأداء لعملية gated_delta_net وتوفير ثنائيات جاهزة لـ macOS وLinux وWindows وAndroid وopenEuler.

يزيل النسخ الزائدة عن الحاجة من CUDA بعد gated_delta_net عن طريق اكتشاف نمط gated_delta_net -> view -> cpy.
يسمح لنواة CUDA GDN بكتابة لقطات الحالة مباشرةً إلى ذاكرة التخزين المؤقت المتكررة، متجاوزةً كتابات الذيل الوسيطة.
يعطل دعم KleidiAI لـ macOS Apple Silicon في هذا الإصدار.
يوفر ثنائيات لـ Ubuntu x64/arm64/s390x مع backends CPU وVulkan وROCm 7.2 وOpenVINO وSYCL.
يتضمن بناءات Windows لـ CPU وOpenCL Adreno وCUDA 12/13 وVulkan وOpenVINO وSYCL وHIP.

يحسّن هذا التحديث كفاءة الاستدلال على بنية وحدات معالجة الرسومات المدعومة مع الحفاظ على توافق واسع عبر أنظمة التشغيل المختلفة ومسرعات الأجهزة.