ملاحظات إصدار MCP Python SDK v2.0.0a3
أصدرت حزمة تطوير البرمجيات (SDK) الخاصة بـ Model Context Protocol (MCP) الإصدار ألفا الثالث، v2.0.0a3، مما يقدم تغييرات كبيرة في البروتوكول والبنية مع الحفاظ على التوافق الخلفي لمستخدمي النسخة المستقرة 1.x.
أصدرت حزمة تطوير البرمجيات (SDK) الخاصة بـ Model Context Protocol (MCP) الإصدار ألفا الثالث، v2.0.0a3، مما يقدم تغييرات كبيرة في البروتوكول والبنية مع الحفاظ على التوافق الخلفي لمستخدمي النسخة المستقرة 1.x.
أصدر مشروع llama.cpp الإصدار b9811، الذي يتضمن إصلاحًا لخطأ في المترجم يؤثر على مسار conv2d coopmat2 في Vulkan. تم تطبيق هذه الحيلة أيضًا على تنفيذ CONV_3D بناءً على اقتراحات من مهندس NVIDIA جيف بولتز.
أطلق مشروع llama.cpp الإصدار b9810، مقدّماً تعيين CUDA لـ `cublasSgemmBatched` في رؤوس البائعين HIP/MUSA. ويأتي هذا التحديث مصحوباً بمجموعة شاملة من الثنائيات المُعدّة مسبقاً لأنظمة macOS وLinux وWindows وAndroid ومنصة openEuler.
أصدرت حزمة تطوير البرمجيات (SDK) للغة Python الخاصة ببروتوكول سياق النموذج الإصدار 1.28.1، حيث تتضمن تحديثات على معالجة التدفق وأمن النقل.
يقدم إصدار llama.cpp b9804 إصلاحًا لهيكلية Mamba2 من خلال إزالة عامل توسيع ثابت بقيمة 2x وفحص معلمة غير صالح، مما يتيح الدعم لأي قيمة توسيع. يحدث هذا التغيير سكريبت `convert_hf_to_gguf.py` لجعل معلمة التوسيع اختيارية مع افتراض قيمته بـ 2.
أطلق مشروع llama.cpp الإصدار b9803، الذي يتضمن إصلاحًا لـ OpenCL لضمان تفريغ دفعات التتبع عند الإغلاق للدفعات غير المكتملة. يوفر هذا التحديث ثنائيات لأنظمة macOS وLinux وWindows وAndroid وopenEuler عبر مختلف خلفيات الأجهزة.
أصدر مشروع llama.cpp الإصدار b9802، والذي يقدم ثنائيات مُعدة مسبقًا عبر أنظمة تشغيل متعددة وبنية عتارية متنوعة. يتضمن هذا التحديث دعمًا لوحدة المعالجة المركزية (CPU)، ووحدات معالجة الرسومات (GPU)، ومسرعات الذكاء الاصطناعي المتخصصة على منصات مثل macOS وLinux وWindows وAndroid وopenEuler.
تعلن المقالة عن إصدار الإصدار 0.5.14.
يُقدم إصدار Claude Code 2.1.193 تحسينات متعددة في تصنيف الوضع التلقائي، وتسجيل البيانات التشغيلية (telemetry)، وإدارة الوكلاء الخلفيين. يتضمن هذا التحديث أيضاً إصلاحات لمشاكل حالة واجهة المستخدم، ومعالجة المصادقة في خوادم MCP، ومختلف الأخطاء المتعلقة بالعمل الخلفي.
تصف هذه المقالة منهجية لأتمتة صيانة شُعب البرمجيات باستخدام وكلاء كتابة الأكواد بالذكاء الاصطناعي، وتطبقها على شعبة Cohere الخاصة بـ vLLM. يقلل هذا النهج الوقت اللازم لدمج الإصدارات الأصلية من الأسابيع إلى الأيام عن طريق استبدال التدخل البشري بدورة تغذية راجعة آلية.
طور الباحثون اختبار السببية التوليدية (GCT)، وهو إطار عمل يترجم نماذج التنبؤ بالدماغ القائمة على نماذج لغوية كبيرة والتي يصعب تفسيرها إلى فرضيات كلامية موجزة وقابلة للاختبار حول وظيفة القشرة الدماغية. تقوم هذه الطريقة بتكثيف معاملات النموذج في عبارات قصيرة تصف ما تستجيب له مناطق دماغية محددة، مثل "تحضير الطعام"، ثم تتحقق من هذه الشروحات من خلال تجارب التصوير بالرنين المغناطيسي الوظيفي (fMRI) المستهدفة.
غادر جوجل فاينانس رسمياً مرحلته التجريبية وأطلق تطبيقاً مخصصاً لأجهزة أندرويد.
يعالج هذا المرشح الإصداري مشكلة في وظيفة Prefill/Decode (P/D) بالتزامن مع مشرف التوازي البياناتي (DP) ضمن مشروع vLLM.
طوّرت كوهير وكيل أمان باستخدام منصتها للذكاء الاصطناعي المؤسسي، كوهير نوث، المتكاملة مع منصة أمان السحابة ويز من خلال خادم بروتوكول سياق النموذج (MCP) مخصص. تربط هذه البنية نوث بواجهة برمجة التطبيقات GraphQL الخاصة بـ وي즈 عبر ثماني أدوات ذرية، مما يتيح سير عمل استجابة الحوادث المؤتمتة من مطالبة واحدة. يقوم النظام بتحليل نطاق انفجار التركيبات السامة من خلال تقييم سلاسل الهجمات وترتيب المخاطر بناءً على التعرض للإنترنت ومستويات الامتياز في حوالي 20 ثانية. كما يؤتمت التحقيق الشامل من البداية للنهاية عن طريق استرداد تفاصيل المشكلة، وإنشاء تذاكر Linear، وتحديث حالة وي즈، وصياغة تقارير استجابة الحوادث المهيكلة. بالإضافة إلى ذلك، يولّد أتمتة مجدولة أسبوعياً موجزاً لوضع الأمان كل صباح يوم الاثنين دون تدخل يدوي. تلغي هذه التكامل حلقة الفرز السابقة التي كانت تستغرق من 30 دقيقة إلى ساعتين لكل اكتشاف، مما يسمح للمهندسين بالتركيز على تقييم التقييمات بدلاً من التنبيهات الخام.
يُطلق إصدار llama.cpp ب9788 دعمًا لتوازي المصفوفات عبر العلم --split-mode tensor في الخلفية SYCL. يتيح هذا التنفيذ التواصل بين GPUين بإضافة دوال comm_init وcomm_free وcomm_allreduce_tensor إلى meta-backend. بالنسبة لجهازين، يستخدم استراتيجية ring all-reduce التي تتناوب بين نسخ FP32 المباشر للصفائف الصغيرة وضغط BF16 للصفائف الأكبر. يتجنب الكود استخدام OneCCL بسبب قيوده على جهاز واحد لكل عملية، ويعتمد بدلاً من ذلك على مخازن مؤقتة دائمة للحفاظ على ثوابت مجموعة SYCL. أظهرت اختبارات الأداء على GPUين Intel Arc Pro B70 تسريعات كبيرة مقارنة بوضع الطبقات لنماذج Llama-3.3-70B وQwen3-Coder-Next-80B-A3B. يتضمن التحديث ثنائيات جديدة لأنظمة macOS وLinux وWindows وAndroid وopenEuler عبر أهداف CPU وCUDA وROCm وVulkan وSYCL.
أصدر مشروع llama.cpp الإصدار b9788، الذي يتضمن إصلاحًا حاسمًا لكم نماذج Mixture of Experts (MoE) مع التنبؤ متعدد الرموز. يعالج هذا التحديث المشكلات التي تم تحديدها في طلب السحب #24986 لضمان التعامل الصحيح مع هذه البنى النموذجية المحددة. يوفر الإصدار ثنائيات مُعدّة مسبقًا لكل من macOS Apple Silicon وIntel، بالإضافة إلى iOS XCFramework. يمكن لمستخدمي Linux تنزيل الإصدارات لـ Ubuntu عبر الخلفيات CPU وVulkan وROCm 7.2 وOpenVINO وSYCL. يتضمن دعم Windows متغيرات CPU وCUDA 12.4 و13.3 وVulkan وOpenVINO وSYCL وHIP. كما تدعم منصات إضافية مثل Android arm64 وopenEuler مع تكوينات الأجهزة المحددة.
تُظهر ورقة بحثية جديدة من OpenAI كيف أن وكلاء الذكاء الاصطناعي يغيّرون جذرياً طبيعة العمل. تسلط الدراسة الضوء على قدرة هذه الوكلاء على تنفيذ مهام أطول وأكثر تعقيداً مما كان ممكناً سابقاً. يُعزى هذا التقدم التكنولوجي إلى توسيع الإنتاجية عبر مجموعة واسعة من الأدوار المهنية. تشير النتائج إلى تحول كبير في كيفية تنظيم العمل وأدائه من خلال الأتمتة. ومن خلال التعامل مع سير العمل المعقد، يمكّن وكلاء الذكاء الاصطناعي المستخدمين من تحقيق كفاءة أكبر. تُعد الورقة دليلاً على التأثير المتزايد للأنظمة المستقلة على التوظيف الحديث.
قام مستودع llama.cpp بمعالجة مشكلة محددة تتعلق بالخلفية (backend) الخاصة بـ SYCL. تم تقديم طلب سحب (pull request) لإصلاح حالات اختبار الوحدات الفاشلة المرتبطة بعملية conv_3d. يستهدف هذا التحديث مشروع ggml-org/llama.cpp على GitHub. تحل التغييرات الأخطاء التي كانت تمنع سابقاً التنفيذ الناجح لهذه الاختبارات. يضمن هذا الإصلاح استقراراً أفضل للمستخدمين الذين يعتمدون على تسريع الأجهزة القائم على SYCL.
أطلق مشروع llama.cpp الإصدار b9786، الذي يقدم دعمًا للصفوف غير المتجاورة في التطبيع عبر OpenCL. يُعد هذا التحديث جزءًا من التطوير المستمر الذي تقوم به فريق ggml-org لتعزيز توافق الأجهزة والأداء عبر منصات مختلفة. يوفر الإصدار ثنائيات (binaries) لنظام macOS على شرائح Apple Silicon وMac بمعالجات Intel، وإطارات عمل XCFrameworks لنظام iOS. يمكن لمستخدمي Linux الوصول إلى التجميعات لأنظمة Ubuntu x64 وarm64 وs390x باستخدام backends المعتمدة على CPU وVulkan وROCm 7.2 وOpenVINO وSYCL. يتوفر دعم Android لأجهزة arm64 CPU، بينما يقدم Windows خيارات واسعة تشمل CPU وCUDA 12 و13 وVulkan وOpenVINO وSYCL وHIP. يذكر الإصدار أيضًا التجميعات المعطلة لـ KleidiAI على منصات macOS وopenEuler.
أطلق مشروع llama.cpp الإصدار b9785، والذي يتضمن تغييرًا في الكود لتقوية فحوصات القيم القصوى كما هو مفصل في طلب السحب #24973. يوفر هذا التحديث ثنائيات جاهزة للبناء لأنظمة macOS Apple Silicon وMac Intel وiOS عبر XCFramework، مع تعطيل دعم KleidiAI على Apple Silicon. تُدعم توزيعات Linux بما في ذلك Ubuntu لكل من backends المعالج المركزي (CPU) وVulkan وROCm 7.2 وOpenVINO وSYCL عبر بنية x64 وarm64 وs390x. يمكن لمستخدمي Android الوصول إلى ثنائيات arm64 للمعالج المركزي، بينما يوفر Windows خيارات واسعة تغطي CPU وOpenCL Adreno وCUDA 12 و13 وVulkan وOpenVINO وSYCL وHIP. يتضمن الإصدار أيضًا عمليات بناء لنظام openEuler تستهدف معالجات x86 وaarch64 مع دعم ACL Graph. تتوفر حزمة واجهة مستخدم مستقلة إلى جانب الإصدارات الخاصة بكل منصة لتسهيل الاستدلال المحلي للنماذج.