إصدار llama.cpp b9831 يضيف دعم DFlash وثنائيات جديدة
يُقدم إصدار llama.cpp b9831 دعمًا لـ DFlash v2، بما في ذلك انتباه النافذة المنزلقة حسب أنواع الطبقات، جنبًا إلى جنب مع مجموعة شاملة من الثنائيات المُعدة مسبقًا لأنظمة متعددة.
يُقدم إصدار llama.cpp b9831 دعمًا لـ DFlash v2، بما في ذلك انتباه النافذة المنزلقة حسب أنواع الطبقات، جنبًا إلى جنب مع مجموعة شاملة من الثنائيات المُعدة مسبقًا لأنظمة متعددة.
يُقدم إصدار llama.cpp b9830 القدرة على استخدام العلم --offline مع أمر تحميل llama، مما يسمح للسكريبتات بالتحقق من النماذج المخزنة مؤقتًا دون الحاجة إلى اتصال بالشبكة. كما يحل هذا التحديث ثغرة use-after-free كامنة في استدعاء on_done الخاص بمهمة URL حيث كان first_path يُلتقط بشكل غير صحيح بواسطة المرجع.
أطلق مشروع llama.cpp الإصدار b9829، والذي يتضمن تقليلًا لإخراج السجلات في الخادم والمكونات المشتركة ووحدات فك التشفير المتوقعة. كما يوحّد هذا التحديث اتفاقيات التسمية عن طريق استبدال CMN_ بـ COM_.
يُقدم إصدار llama.cpp b9828 تحسينات كبيرة في OpenCL، وتحديداً بإعادة صياغة نوى Flash Attention لدقة f16 وf32. يتضمن هذا التحديث نوى prefill prepass جديدة ودعمًا لتنسيقات الكمّية q4_0 وq8_0.
يُطلق إصدار llama.cpp b9827 تحسينًا للأداء في CUDA من خلال إضافة مسار سريع لـ cudaMemcpy2DAsync إلى دالة ggml_cuda_cpy. يُسرّع هذا التغيير عمليات النسخ المتدرجة (strided) التي تكون فيها الأنواع والأشكال متطابقة، حيث لا تكون الموترات متصلة بالكامل ولكن كل صف متصل، مما يحل محل نوى نسخ العناصر القياسية الأبطأ.
أصدر مشروع llama.cpp الإصدار b9825، والذي يتضمن إصلاحًا لمعامل خطوة Vulkan عند التعامل مع المدخلات الصفرية. يوفر هذا التحديث ثنائيات جاهزة للبناء لأنظمة macOS وLinux وWindows وAndroid وopenEuler عبر مختلف الخلفيات العتقية.
أصدر مشروع llama.cpp الإصدار b9826، الذي يتضمن إصلاحاً لحالات اختبارات الوحدة الفاشلة المتعلقة بدالة norm في SYCL. يوفر هذا التحديث ثنائيات جاهزة وأطر عمل عبر منصات متعددة ومسرعات الأجهزة.
أصدر مشروع llama.cpp الإصدار b9822، الذي يوفر ثنائيات جاهزة للبناء لأنظمة macOS وiOS وLinux وAndroid وWindows. يتضمن هذا التحديث إصلاحًا لخيار --no-common في قالب الاختبار test-chat-template، ويوزع البناء عبر بنية عتادية مختلفة ومسرعات متعددة.
أصدر مشروع llama.cpp الإصدار b9823، والذي يوفر ملفات ثنائية جاهزة للبناء لأنظمة macOS وiOS وLinux وAndroid وWindows ومنصة openEuler. تتمثل إحدى التغييرات الرئيسية في هذا الإصدار في إضافة بناء OpenVINO الخاص بـ Windows إلى خط أنابيب التحقق من الإصدارات.
أصدر مشروع llama.cpp الإصدار b9824، الذي يتضمن تحسينات لثنائيات rpc-server وexport-graph-ops. تم إعادة تسمية الأداة `export-graph-ops` لتتبع اتفاقيات تسمية الاختبارات، بينما تم إعادة تسمية `rpc-server` إلى `ggml-rpc-server` لتجنب التعارضات في أدلة النظام.
يتضمن إصدار v0.24.0 تحديثًا للتكامل المستمر لزيادة مهلة بدء تشغيل GSM8K لتكوينات MoE Refactor Qwen3 NVFP4.
بدأت OpenAI عرضًا محدودًا لسلسلة GPT-5.6، مقدمةً ثلاثة نماذج جديدة: Sol كنموذج رائد، وTerra للعمل اليومي المتوازن، وLuna للمهام السريعة والمنخفضة التكلفة. تخطط الشركة لجعل هذه النماذج متاحة للعامة في الأسابيع القادمة بعد هذه المرحلة الأولية مع شركاء موثوقين.
أصدر مشروع llama.cpp الإصدار b9821، الذي يُدخل تحديثات على واجهة سطر الأوامر تتيح للمستخدمين استدعاء الأعلام --version و--licenses و--help. يوفر هذا الإصدار مجموعة شاملة من الثنائيات الجاهزة لـ macOS وLinux وAndroid وWindows وopenEuler عبر مسرعات عتادية متنوعة.
يُقدم إصدار Claude Code 2.1.195 عدة إصلاحات وتحسينات، بما في ذلك متغيرات بيئة جديدة للتحكم بالماوس في وضع ملء الشاشة وتصحيحات لمنطق مطابقة الخطافات.
يُقدم إصدار llama.cpp b9820 تحسينات في الأداء من خلال إعادة إدخال عمليات مزامنة أقل أثناء الحساب المقسّم، ويستهدف بشكل خاص الخلفيات (backends) الخاصة بـ CUDA. يوفر هذا التحديث أيضاً ثنائيات جاهزة للبناء (pre-built binaries) لأنظمة macOS وLinux وWindows وAndroid وopenEuler عبر معالجات CPU وGPU ومسرعات الأجهزة المتخصصة.
أصدر مشروع llama.cpp الإصدار b9816، والذي يتضمن مزامنة مع مكتبة ggml. يوفر هذا التحديث ثنائيات جاهزة للبناء لأنظمة macOS وiOS وLinux وWindows وAndroid ومنصة openEuler.
يحدث إصدار llama.cpp b9817 الخلفية البرمجية لـ OpenVINO إلى الإصدار 2026.2.1 ويجعل حزم الإصدار الخاصة بها مستقلة بذاتها. يتضمن هذا التحديث عدة تحسينات للمشغلات داخل خلفية OpenVINO، مثل إزالة مجموعات compute_op_type الثابتة وتمكين softmax مع مدخلات sink.
يُطلق إصدار llama.cpp b9813 دعم Vulkan لأجهزة Intel Xe-LPG Plus من خلال إضافة تعريف بنية INTEL_XE1 وتمكين coopmat1. يعالج هذا التحديث تعليقات الكود السابقة، ويعيد تسمية معرف البنية، ويتضمن فحصًا لبرامج تشغيل Windows.
أطلق مشروع llama.cpp الإصدار b9814، الذي يتضمن تحسينًا لعملية `mul_mat_vecq` في Vulkan موجهًا تحديدًا لوحدة معالجة الرسومات AMD mi50. ويأتي هذا التحديث مصحوبًا بمجموعة شاملة من الثنائيات الجاهزة عبر أنظمة تشغيل متعددة وبنية عتادية مختلفة.
أصدرت حزمة تطوير البرمجيات (SDK) الخاصة بـ Model Context Protocol (MCP) الإصدار ألفا الثالث، v2.0.0a3، مما يقدم تغييرات كبيرة في البروتوكول والبنية مع الحفاظ على التوافق الخلفي لمستخدمي النسخة المستقرة 1.x.