إصدار llama.cpp b9851 يصلح مشكلة التقاطع الصحيح في CUDA ويوفر ملفات جاهزة

أصدر مشروع llama.cpp الإصدار b9851، والذي يتضمن إصلاحًا لـ CUDA لمنع أخطاء التقاطع الصحيح والتجاوز في نواة flash_attn_mask_to_KV_max. يعالج هذا التحديث المشكلات المتعلقة بخطوات قناع KQ داخل النواة المحددة.

تتوفر ملفات جاهزة لنظام macOS Apple Silicon (arm64)، بينما تم تعطيل دعم KleidiAI.
تغطي الإصدارات الخاصة بـ Linux أنظمة Ubuntu x64 و arm64 لوحدة المعالجة المركزية، و Vulkan، و ROCm 7.2، و OpenVINO، و SYCL FP32/FP16.
يتم توفير ملفات جاهزة لنظام Android arm64 (وحدة المعالجة المركزية) للأجهزة المحمولة.
تتضمن إصدارات Windows متغيرات لوحدة المعالجة المركزية، و OpenCL Adreno، و CUDA 12/13، و Vulkan، و OpenVINO، و SYCL، و HIP.
تم سرد الإصدارات الخاصة بـ openEuler لعمارتَي x86 و aarch64، مع تعطيل بعض التكوينات.
تتضمن ملفات الإصدار أيضًا ملفًا جاهزًا لوحدة واجهة المستخدم المستقلة.

يضمن هذا الإصدار الاستقرار لمستخدمي CUDA من خلال تصحيح أخطاء الحساب، ويوفر ملفات جاهزة شاملة عبر أنظمة التشغيل الرئيسية ومسرعات الأجهزة.