كل المقالات
github llama.cpp · منذ 11 يوم

إصلاح لفشل عشوائي في اختبار تحليل المعاملات على نظام ويندوز

يعالج التصحيح الفشل العشوائي في اختبار تحليل المعاملات (test-args-parser) على نظام ويندوز من خلال تعديل تجاوز argv ليُطبَّق فقط عندما يتطابق argc، مما يمنع طمس المعاملات البرمجية. وهذا يُصلح خطأ فشل سريع (fastfail assertion) في سير عمل OpenVINO على ويندوز مع الحفاظ على معالجة UTF-8 للثنائيات الحقيقية.

github llama.cpp · منذ 11 يوم

إصدار llama.cpp b9738: إصلاحات على توجيه رأس المصادقة CORS وبناء ثنائيات جديدة

يصلح إصدار llama.cpp بـ b9738 الوكيل الوسيط لـ CORS لتجنب توجيه رؤوس المصادقة. يتضمن الإصدار بناءً لملفات قابلة للتنفيذ لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر معماريات متعددة وخيارات تسريع الأجهزة، بما في ذلك Vulkan وCUDA وOpenVINO وSYCL.

github llama.cpp · منذ 11 يوم

ggml يحسّن أداء AMX عبر تسطيح التقسيم

قام مشروع ggml بتحسين أداء AMX عن طريق تسطيح التقسيم على n_batch * M، مما يضمن مشاركة جميع الخيوط في عملية التكميم. هذا التغيير يحسّن السرعة بنسبة تصل إلى 1.47x عبر نماذج وتكوينات عتادية مختلفة على منصات CPU وGPU، مع إظهار النتائج مكاسب متسقة في وقت الاستدلال.

github llama.cpp · منذ 11 يوم

تصحيح فهرس DSA في GLM-5.2: موترات مُعلَّمة بأنها غير مطلوبة

تم تحميل فهرس DSA الخاص بنموذج GLM-5.2 بشكل خاطئ على جميع الطبقات، مما تسبب في فشل بسبب موترات مفقودة. تُعلِّم التحديثات موترات الفهرس بـ TENSOR_NOT_REQUIRED، مما يسمح للطبقات التي لا تحتوي على فهرس بأن تُحمَّل كـ nullptr ويمكّن من انتباه MLA الكامل. لم يتأثر DeepSeek-V3.2، الذي يستخدم فهرسة موحدة.

github llama.cpp · منذ 12 يوم

إصدار LLaMA.cpp b9732: ثنائيات جديدة وتحديثات

أصدرت LLaMA.cpp الإصدار b9732 مع ثنائيات محدثة لأنظمة macOS وLinux وAndroid وWindows وopenEuler. يتضمن الإصدار إعادة هيكلة لاتصال الطفل-إلى-الموجّه، وإصلاحات لمعالجة الاستيقاظ، وتحسين لـ update_status()، والتوثيق. تدعم التجميعات الجديدة Vulkan وROCm وOpenVINO وSYCL وCUDA 12/13 على عدة معماريات.

github llama.cpp · منذ 12 يوم

ggml-webgpu يضيف مفاتيح تبديل المحول F16 لـ Vulkan وNVIDIA

أضاف مشروع ggml-webgpu مفاتيح تبديل للمحول لدعم الدقة النصفية (F16) على وحدات معالجة الرسومات Vulkan وNVIDIA. يتيح هذا التحديث أداءً محسّنًا على الأجهزة المتوافقة عبر منصات متعددة، بما في ذلك macOS وLinux وAndroid وWindows وopenEuler، مع توفر إصدارات مخصصة لهندسة ARM وx64.

github llama.cpp · منذ 12 يوم

إصدار llama.cpp b9731: تحسين الأداء وثنائيات عبر المنصات

يُقدم إصدار llama.cpp b9731 تحسينًا باستخدام std::partial_sort لتقليل عبء ترتيب الرموز، مما يحسن الأداء من 8.555 مللي ثانية إلى 0.704 مللي ثانية لاختيار أعلى n رمزًا. يتضمن الإصدار ثنائيات جاهزة لـ macOS وLinux وAndroid وWindows وopenEuler عبر بنية متعددة وخيارات تسريع الأجهزة.

github llama.cpp · منذ 12 يوم

إصدار LLaMA.cpp b9728 يضيف دعم أسطر التعليقات وثنائيات متعددة المنصات

يُقدم إصدار LLaMA.cpp بـ b9728 دعمًا لأسطر التعليقات في تكوين --api-key-file. يتضمن الإصدار ثنائيات مُعدة مسبقًا لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر العديد من المعماريات وخيارات تسريع الأجهزة، بما في ذلك Vulkan وCUDA وOpenVINO وSYCL.

github llama.cpp · منذ 12 يوم

إصدار llama.cpp b9724 مع إصلاحات الأخطاء وثنائيات عبر المنصات

يتضمن إصدار llama.cpp b9724 عدة إصلاحات للأخطاء وتحسينات، مثل إصلاحات البناء، وتجنب تجاوز السعة في دالة area()، وفحص الصحة في get_u32(). يوفر الإصدار ثنائيات مُعدة مسبقًا لأنظمة macOS (arm64 وx64)، وLinux (x64، arm64، s390x، Vulkan، ROCm، OpenVINO، SYCL)، وAndroid (arm64)، وWindows (x64، arm64، CUDA 12/13، Vulkan، OpenVINO، SYCL، HIP)، وopenEuler (x86 وaarch64 مع دعم ACL Graph)، بالإضافة إلى حزمة واجهة المستخدم.

github llama.cpp · منذ 12 يوم

إصدار llama.cpp b9723 يضيف دعمًا لـ Qwen3.5 و Qwen3.6 Eagle3

تقدم إصدار llama.cpp b9723 دعمًا لنماذج Qwen3.5 و Qwen3.6 عبر Eagle3. يتضمن الإصدار استعادة نقاط التفتيش الحدودية المؤجلة للنماذج الهجينة وتحديثات لـ API واتفاقيات التسمية. تتوفر تجميعات ثنائية لمنصات macOS و Linux و Android و Windows و openEuler، مع خيارات لـ CPU و Vulkan و OpenVINO و SYCL و ROCm.