كل المقالات
github llama.cpp · منذ 10 يوم

إصدار llama.cpp b9747 يضيف تتبع تحميل النموذج في الوقت الفعلي وثنائيات منصات جديدة

يُقدم إصدار llama.cpp بـ b9747 تتبع تقدم تحميل النموذج في الوقت الفعلي عبر نقاط نهاية SSE. يتضمن الإصدار ثنائيات لأنظمة macOS وLinux وAndroid وWindows وopenEuler، ويدعم مختلف البنى التكنولوجية وتقنيات التسريع مثل Vulkan وCUDA وOpenVINO وSYCL.

github llama.cpp · منذ 10 يوم

إصدار llama.cpp b9745 يضيف دعم MTP3 وملفات ثنائية متعددة المنصات

يُقدم إصدار llama.cpp بـ b9745 دعمًا لـ Step3.5/3.7 flash MTP3، بما في ذلك واجهات برمجة تطبيقات جديدة لمؤشر الطبقة وعلم flags nextn. يوفر الإصدار ملفات ثنائية جاهزة للبناء لأنظمة macOS وLinux وAndroid وWindows وopenEuler، مع خيارات لتسريع المعالج المركزي (CPU) وVulkan وCUDA وOpenVINO وSYCL.

github llama.cpp · منذ 11 يوم

إصدار llama.cpp b9742: محدّث بخطوة مدعومة لأوزان SSM-conv

يُقدّم إصدار llama.cpp بـ b9742 خطوة مدعومة لأوزان SSM-conv، مما يحسّن الكفاءة في عمليات الشبكات العصبية. يتضمن الإصدار ثنائيات لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر معماريات وبروتوكولات متعددة بما في ذلك Vulkan وCUDA وOpenVINO وSYCL.

github llama.cpp · منذ 11 يوم

إصدار llama.cpp b9743 يضيف ثنائيات جديدة ودعمًا لبطاقات الرسوميات

يُقدم إصدار llama.cpp بـ b9743 ثنائيات جديدة لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر معماريات متعددة. يتضمن الإصدار دعمًا لـ Vulkan وCUDA 12.4 و13.3 وOpenVINO وSYCL وROCm، مع واجهة مستخدم محدّقة وقواعد مسافات مُحسّنة في المحاكي عبر مواءمة مخطط JSON مع القواعد النحوية.

github llama.cpp · منذ 11 يوم

إصلاح لفشل عشوائي في اختبار تحليل المعاملات على نظام ويندوز

يعالج التصحيح الفشل العشوائي في اختبار تحليل المعاملات (test-args-parser) على نظام ويندوز من خلال تعديل تجاوز argv ليُطبَّق فقط عندما يتطابق argc، مما يمنع طمس المعاملات البرمجية. وهذا يُصلح خطأ فشل سريع (fastfail assertion) في سير عمل OpenVINO على ويندوز مع الحفاظ على معالجة UTF-8 للثنائيات الحقيقية.

github llama.cpp · منذ 11 يوم

إصدار llama.cpp b9738: إصلاحات على توجيه رأس المصادقة CORS وبناء ثنائيات جديدة

يصلح إصدار llama.cpp بـ b9738 الوكيل الوسيط لـ CORS لتجنب توجيه رؤوس المصادقة. يتضمن الإصدار بناءً لملفات قابلة للتنفيذ لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر معماريات متعددة وخيارات تسريع الأجهزة، بما في ذلك Vulkan وCUDA وOpenVINO وSYCL.

github llama.cpp · منذ 11 يوم

ggml يحسّن أداء AMX عبر تسطيح التقسيم

قام مشروع ggml بتحسين أداء AMX عن طريق تسطيح التقسيم على n_batch * M، مما يضمن مشاركة جميع الخيوط في عملية التكميم. هذا التغيير يحسّن السرعة بنسبة تصل إلى 1.47x عبر نماذج وتكوينات عتادية مختلفة على منصات CPU وGPU، مع إظهار النتائج مكاسب متسقة في وقت الاستدلال.

github llama.cpp · منذ 11 يوم

تصحيح فهرس DSA في GLM-5.2: موترات مُعلَّمة بأنها غير مطلوبة

تم تحميل فهرس DSA الخاص بنموذج GLM-5.2 بشكل خاطئ على جميع الطبقات، مما تسبب في فشل بسبب موترات مفقودة. تُعلِّم التحديثات موترات الفهرس بـ TENSOR_NOT_REQUIRED، مما يسمح للطبقات التي لا تحتوي على فهرس بأن تُحمَّل كـ nullptr ويمكّن من انتباه MLA الكامل. لم يتأثر DeepSeek-V3.2، الذي يستخدم فهرسة موحدة.

github llama.cpp · منذ 12 يوم

إصدار LLaMA.cpp b9732: ثنائيات جديدة وتحديثات

أصدرت LLaMA.cpp الإصدار b9732 مع ثنائيات محدثة لأنظمة macOS وLinux وAndroid وWindows وopenEuler. يتضمن الإصدار إعادة هيكلة لاتصال الطفل-إلى-الموجّه، وإصلاحات لمعالجة الاستيقاظ، وتحسين لـ update_status()، والتوثيق. تدعم التجميعات الجديدة Vulkan وROCm وOpenVINO وSYCL وCUDA 12/13 على عدة معماريات.

github llama.cpp · منذ 12 يوم

ggml-webgpu يضيف مفاتيح تبديل المحول F16 لـ Vulkan وNVIDIA

أضاف مشروع ggml-webgpu مفاتيح تبديل للمحول لدعم الدقة النصفية (F16) على وحدات معالجة الرسومات Vulkan وNVIDIA. يتيح هذا التحديث أداءً محسّنًا على الأجهزة المتوافقة عبر منصات متعددة، بما في ذلك macOS وLinux وAndroid وWindows وopenEuler، مع توفر إصدارات مخصصة لهندسة ARM وx64.

github llama.cpp · منذ 12 يوم

إصدار llama.cpp b9731: تحسين الأداء وثنائيات عبر المنصات

يُقدم إصدار llama.cpp b9731 تحسينًا باستخدام std::partial_sort لتقليل عبء ترتيب الرموز، مما يحسن الأداء من 8.555 مللي ثانية إلى 0.704 مللي ثانية لاختيار أعلى n رمزًا. يتضمن الإصدار ثنائيات جاهزة لـ macOS وLinux وAndroid وWindows وopenEuler عبر بنية متعددة وخيارات تسريع الأجهزة.

github llama.cpp · منذ 12 يوم

إصدار LLaMA.cpp b9728 يضيف دعم أسطر التعليقات وثنائيات متعددة المنصات

يُقدم إصدار LLaMA.cpp بـ b9728 دعمًا لأسطر التعليقات في تكوين --api-key-file. يتضمن الإصدار ثنائيات مُعدة مسبقًا لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر العديد من المعماريات وخيارات تسريع الأجهزة، بما في ذلك Vulkan وCUDA وOpenVINO وSYCL.