يضيف ggml-cpu دعم ذيول K لـ Power10 MMA Q8/Q4
يدعم ggml-cpu الآن ذيول K في ضرب المصفوفات MMA Q8/Q4 على Power10، مما يلغي المتطلب بأن يكون K قابلاً للقسمة على kc. يتيح ذلك لمزيد من أحمال العمل استخدام نواة MMA ويقلل من التراجع إلى mnpack.
يدعم ggml-cpu الآن ذيول K في ضرب المصفوفات MMA Q8/Q4 على Power10، مما يلغي المتطلب بأن يكون K قابلاً للقسمة على kc. يتيح ذلك لمزيد من أحمال العمل استخدام نواة MMA ويقلل من التراجع إلى mnpack.
يضيف الإصدار v0.17.6 حواجز حماية لإدخال الأدوات المعتمدة مسبقًا وبيانات مخصصة عبر SDK فقط لمخرجات الأدوات. كما يفرض عقدًا متوافقًا تمامًا مع JSON لمخرجات الأدوات ويكبح تحذيرات المسافات البيضاء غير الضرورية في أسماء الأدوات. قدم @siddiksawani مساهمته الأولى في هذا الإصدار.
تُضيف الإصدار b9716 من llama.cpp دعم المعالجة الدفعية لـ InternVL، مما يعزز أداء النموذج من خلال معالجة دفعيات فعالة. يتضمن الإصدار تجميعات ثنائية لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر بنية متعددة وخيارات تسريع الأجهزة، بما في ذلك Vulkan وOpenVINO وSYCL وROCm.
أصدرت llama.cpp الإصدار b9713، مضافة دعم البatching إلى mtmd-cli واختبارات الفيديو. تتضمن النسخة ثنائيات لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر بنية متعددة وخيارات تسريع الأجهزة، بما في ذلك Vulkan وCUDA وOpenVINO وSYCL.
يضيف إصدار llama.cpp b9714 الرأس "X-Accel-Buffering": "no" إلى نقاط النهاية للتدفق لمنع Nginx من تخزين الاستجابات مؤقتًا، مما يحل مشاكل التدفق مع تطبيقات مثل إطار عمل البرمجة Pi. يتضمن الإصدار ثنائيات لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر العديد من المعماريات وخيارات تسريع الأجهزة.
تُقدم الإصدار b9715 من LLaMA.cpp دعم CUDA لـ GGML_OP_COL2IM_1D، بالاستناد إلى تنفيذ على وحدة المعالجة المركزية. يتضمن هذا الإصدار ملفات قابلة للتنفيذ لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر بنية متعددة وأطر تسريع، بما في ذلك Vulkan وROCm وOpenVINO وSYCL.
يضيف v1.14.8a2 إجراءً واحدًا للوكيل إلى تعريفات Flow ويحققق تعبيرات CEL عند وقت التحميل. يتضمن دليل تكامل Datadog جديدًا مع لوحة عمليات قابلة للاستيراد، بالإضافة إلى لقطة وسجل التغييرات المحدّثين لـ v1.14.8a1.
أصدرت llama.cpp الإصدار b9711 مع ثنائيات محدثة لأنظمة macOS وLinux وAndroid وWindows وopenEuler. يتضمن الإصدار دعمًا لـ ARM64 وx64 وVulkan وROCm وOpenVINO وSYCL وHIP، مع ثنائيات مخصصة لتسريع وحدة المعالجة المركزية ووحدة معالجة الرسومات. كما يتوفر حزمة واجهة مستخدم جديدة.
يتضمن إصدار llama.cpp بـ b9712 إصلاحًا لمشاكل بناء واجهة المستخدم الناتجة عن ملفات المصدر المقروءة فقط. يوفر الإصدار ثنائيات جاهزة للبناء لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر عدة معماريات وخيارات تسريع الأجهزة، بما في ذلك Vulkan وCUDA وOpenVINO وSYCL.
يحسّن الإصدار v2.1.183 أمان الوضع التلقائي عن طريق حظر أوامر git و destroy المدمرة دون موافقة صريحة من المستخدم. يضيف تحذيرات تقادم للنماذج، ويُدخل attribution.sessionUrl لإخفاء روابط الجلسات، ويُصلح عدة مشكلات تشمل سلوك الطرفية، وأداء الوكيل الفرعي، ومعالجة الإدخال في بيئات الويب وtmux.
يقدم إصدار llama.cpp b9707 التحقق من الميحسينات في رسائل الخطأ. يتضمن بناءات ثنائية لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر بنية متعددة وخيارات تسريع الأجهزة.
أصدرت LangGraph الإصدار 1.2.6، الذي يصلح خللاً حيث كانت الشبكات الفرعية المتداخلة ترث بشكل غير صحيح قيمة checkpoint_ns الخاصة بالشبكة الأم. كما يحسّن هذا التحديث إلغاء الشبكات الفرعية قيد التشغيل أثناء عمليات إيقاف التدفق، ويتضمن تحديثاً لإصدار سطر الأوامر إلى 0.4.30.
يضيف الإصدار 1.14.8a1 تعبير if اختياريًا إلى كل خطوة .do ويصحح مشكلات JSON crew. تم تحديث لقطة الشاشة وسجل التغييرات للإصدار v1.14.8a. يشمل المساهمون @joaomdmoura و @vinibrsl.
يتضمن llama.cpp الإصدار b9703 إعادة هيكلة لـ preset handling الخاص بالسيرفر، مع إزالة دعم preset من HF عن بُعد والدوال المتروكة. يوفر هذا الإصدار ملفات ثنائية (binaries) لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر بنية متعددة وخيارات تسريع الأجهزة، بما في ذلك Vulkan وCUDA وOpenVINO وSYCL.
يعيد إصدار llama.cpp b9704 الآن رمز HTTP 400 عند وجود قواعد غير صالحة بدلاً من تجاهل القيود بصمت. يتضمن الإصدار ثنائيات لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر العديد من المعماريات ومسرعات الأجهزة، مع دعم لـ Vulkan وROCm وOpenVINO وSYCL وCUDA.
يتضمن إصدار llama.cpp بـ b9702 إصلاحًا لعدم تمرير معلمات الراوتر إلى المثيلات الفرعية. يوفر الإصدار ثنائيات لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر عدة بنى وخيارات تسريع الأجهزة، بما في ذلك Vulkan وROCm وOpenVINO وSYCL.
يقدم إصدار llama.cpp b9701 معالجًا مسبقًا مُعاد تصميمه مع ميزة mtmd_image_preproc_out جديدة وتوثيق مطورين محدّث. تتضمن الإصدارات الثنائية لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر بنية متعددة وخيارات تسريع الأجهزة، بما في ذلك Vulkan وCUDA وOpenVINO وSYCL.
يقدم إصدار llama.cpp بـ b9700 دعمًا محدثًا لـ SYCL مع إعادة تسمية أعلام واجهة برمجة التطبيقات: تم إعادة تسمية GGML_SYCL_SUPPORT_LEVEL_ZERO إلى GGML_SYCL_SUPPORT_LEVEL_ZERO_API وGGML_SYCL_ENABLE_LEVEL_ZERO إلى GGML_SYCL_USE_LEVEL_ZERO_API. يتضمن الإصدار ثنائيات لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر بنية متعددة وخيارات تسريع الأجهزة، بما في ذلك Vulkan وROCm وOpenVINO وSYCL.
LLaMA.cpp version b9698 enables self-updates only when built with llama-install.sh. The release includes binaries for macOS, Linux, Android, Windows, and openEuler across multiple architectures and hardware acceleration options, including Vulkan, CUDA, OpenVINO, and SYCL.
llama.cpp version b9699 introduces support for MUL_MAT and OUT_PROD operations with Q1_0 precision via PR #24721. The release includes precompiled binaries for macOS, Linux, Android, Windows, and openEuler across multiple architectures and acceleration frameworks, including SYCL (FP32 and FP16), Vulkan, CUDA, ROCm, and OpenVINO.