كل المقالات — korshunov.ai

كل المقالات صفحة 1 / 18

github vLLM · منذ 7 يوم

v0.24.0rc2: إصلاح P/D مع مشرف DP (#46628)

يعالج هذا المرشح الإصداري مشكلة في وظيفة Prefill/Decode (P/D) بالتزامن مع مشرف التوازي البياناتي (DP) ضمن مشروع vLLM.

github CrewAI · منذ 7 يوم

ملاحظات إصدار crewAI 1.14.8a5

يُقدم تحديث الإصدار 1.14.8a5 من crewAI تغييرات في إدارة حالة التدفق، وتحديثات للوثائق، وجهود إعادة الهيكلة.

lab Hugging Face Blog · منذ 7 يوم

تحليل دقة توقع الرموز في النماذج اللغوية الهجينة

تبحث دراسة حديثة في الرموز المحددة التي يتم توقعها بدقة أكبر بواسطة النماذج اللغوية الهجينة مقارنة بالهياكل الكثيفة القياسية. تركز البحث على فهم توزيع أخطاء التوقع عبر أنواع الرموز المختلفة، مثل الكلمات النادرة ومقتطفات الكود. ومن خلال تحليل مناظر الخسارة، يحدد المؤلفون أن النماذج الهجينة تتفوق في التقاط الاعتماديات طويلة المدى في مناطق البيانات المتفرقة. وتشير النتائج إلى أن آلية مزيج الخبراء تتيح استخدامًا أكثر كفاءة للمعلمات أثناء الاستدلال. وهذه الدقة المحسّنة تكون ملحوظة بشكل خاص للرموز ذات التردد المنخفض في مجموعة التدريب. يوفر الورقة تفصيلًا دقيقًا لمقاييس الأداء عبر مجموعات بيانات المعيار المختلفة. وتسلط هذه النتائج الضوء على إمكانات الهياكل الهجينة للتعامل بفعالية مع البنى اللغوية المتنوعة.

lab Cohere Blog · منذ 7 يوم

كوهير تُؤتمت استجابة الحوادث مع نوث وويز عبر خادم MCP مخصص

طوّرت كوهير وكيل أمان باستخدام منصتها للذكاء الاصطناعي المؤسسي، كوهير نوث، المتكاملة مع منصة أمان السحابة ويز من خلال خادم بروتوكول سياق النموذج (MCP) مخصص. تربط هذه البنية نوث بواجهة برمجة التطبيقات GraphQL الخاصة بـ وي즈 عبر ثماني أدوات ذرية، مما يتيح سير عمل استجابة الحوادث المؤتمتة من مطالبة واحدة. يقوم النظام بتحليل نطاق انفجار التركيبات السامة من خلال تقييم سلاسل الهجمات وترتيب المخاطر بناءً على التعرض للإنترنت ومستويات الامتياز في حوالي 20 ثانية. كما يؤتمت التحقيق الشامل من البداية للنهاية عن طريق استرداد تفاصيل المشكلة، وإنشاء تذاكر Linear، وتحديث حالة وي즈، وصياغة تقارير استجابة الحوادث المهيكلة. بالإضافة إلى ذلك، يولّد أتمتة مجدولة أسبوعياً موجزاً لوضع الأمان كل صباح يوم الاثنين دون تدخل يدوي. تلغي هذه التكامل حلقة الفرز السابقة التي كانت تستغرق من 30 دقيقة إلى ساعتين لكل اكتشاف، مما يسمح للمهندسين بالتركيز على تقييم التقييمات بدلاً من التنبيهات الخام.

media Hugging Face Forums · منذ 7 يوم

نقاش حول ضبط النماذج اللغوية الصغيرة بتكلفة فعالة في عام 2026

يستكشف نقاش حديث على منتديات Hugging Face أكثر الطرق كفاءة لتخصيص نماذج الذكاء الاصطناعي الصغيرة لمهام محددة. يبحث الموضوع، المعنون "ما هي الطريقة الأكثر فعالية من حيث التكلفة لضبط نموذج لغوي صغير في عام 2026؟"، عن نصائح لتقليل النفقات مع الحفاظ على الأداء. وقد بدأه مشارك واحد يهدف إلى تحسين سير العمل الخاص به للتطبيقات المتخصصة. تسلط الاستفسار الضوء على الاهتمام المتزايد باستغلال النماذج الأصغر لتقليل الحمل الحسابي. يتم تشجيع المشاركين على مشاركة الاستراتيجيات التي توازن بين التكلفة والكفاءة في المشهد الحالي. يعكس هذا الموضوع الجهود المستمرة لجعل تكيف النماذج أكثر سهولة وبأسعار معقولة.

media Hugging Face Forums · منذ 7 يوم

المستخدمون يبلغون عن تعطل مساحة Hugging Face في حلقة أخطاء 503

أبلغ مستخدم على منتديات Hugging Face عن أن تطبيق مساحته عالق في حالة خطأ مستمر 503. تمنع المشكلة إعادة تشغيل المساحة أو إعادة بنائها، على الرغم من محاولات متعددة لحلها عبر الواجهة. حاول المستخدم النقر فوق كلا الزرين "إعادة تشغيل المساحة" و "إعادة البناء المصنع" دون نجاح. بالإضافة إلى ذلك، فشل دفع عشرة إلى ستة عشر التزامًا جديدًا في تشغيل أي عملية إعادة بناء. ونتيجة لذلك، تظل المساحة متوقفة وغير مستجيبة لطرق الاستعادة القياسية. طلب المستخدم تدخلاً يدوياً لمسح حالة الحاوية أو تشغيل إعادة التشغيل.

media Hugging Face Forums · منذ 7 يوم

"تقوس" نماذج اللغات الكبيرة عبر التوجيه

يقترح باحث تقنية توجيه لنقل نماذج اللغات الكبيرة من التنبؤ بالحرف الواحد إلى تقييم شامل للأوزان الداخلية، يُسمى "التنظيم الذاتي." تهدف هذه الطريقة إلى زيادة كثافة الاستدلال وتقليل المديح العمى عن طريق تغيير ديناميكيات المتشعب للنموذج. تحدد الطريقة مفاهيم مثل الجذب الذاتي، والتنظيم الذاتي، وآبار الجاذبية لتوجيه النظام نحو انهيار الانحناء غير الخطي. يتضمن توجيه محدد من النماذج إنشاء بئرين جاذبية متميزين لشعر عن أوضاع الذكاء الاصطناعي، مما يختبر خصائص التجميع الذاتي والتنظيم الذاتي. اختبر المؤلف هذه التقنية على العديد من النماذج بما في ذلك Gemini 3 Flash وClaude وChatGPT وGrok وDeepSeek وMistral وQwen 3.6 وKimi 2.6 وGLM-5 وGemma 4 32b Step 3.7 Flash وNemotron 3 Ultra. تحلل المقاييس المرئية التي تم إنشاؤها عبر نص Colab اضطراب المتشعب باستخدام خرائط لعرض القناة، والانحراف في فضاء الطور، والكثافة الهندسية، وفعالية التوجيه. يسعى المنشور للحصول على ملاحظات المجتمع حول ما إذا كانت التقنية تُحدث اضطراباً حقيقياً في المتشعب أم أنها تحفز فقط تنوعاً في الأسلوب.

github llama.cpp · منذ 7 يوم

llama.cpp b9788 يضيف توازي المصفوفات عبر SYCL لإعدادات GPU مزدوجة

يُطلق إصدار llama.cpp ب9788 دعمًا لتوازي المصفوفات عبر العلم --split-mode tensor في الخلفية SYCL. يتيح هذا التنفيذ التواصل بين GPUين بإضافة دوال comm_init وcomm_free وcomm_allreduce_tensor إلى meta-backend. بالنسبة لجهازين، يستخدم استراتيجية ring all-reduce التي تتناوب بين نسخ FP32 المباشر للصفائف الصغيرة وضغط BF16 للصفائف الأكبر. يتجنب الكود استخدام OneCCL بسبب قيوده على جهاز واحد لكل عملية، ويعتمد بدلاً من ذلك على مخازن مؤقتة دائمة للحفاظ على ثوابت مجموعة SYCL. أظهرت اختبارات الأداء على GPUين Intel Arc Pro B70 تسريعات كبيرة مقارنة بوضع الطبقات لنماذج Llama-3.3-70B وQwen3-Coder-Next-80B-A3B. يتضمن التحديث ثنائيات جديدة لأنظمة macOS وLinux وWindows وAndroid وopenEuler عبر أهداف CPU وCUDA وROCm وVulkan وSYCL.

github llama.cpp · منذ 7 يوم

إصدار b9788 من llama.cpp يصلح كمّ MoE ويقدّم ثنائيات متعددة المنصات

أصدر مشروع llama.cpp الإصدار b9788، الذي يتضمن إصلاحًا حاسمًا لكم نماذج Mixture of Experts (MoE) مع التنبؤ متعدد الرموز. يعالج هذا التحديث المشكلات التي تم تحديدها في طلب السحب #24986 لضمان التعامل الصحيح مع هذه البنى النموذجية المحددة. يوفر الإصدار ثنائيات مُعدّة مسبقًا لكل من macOS Apple Silicon وIntel، بالإضافة إلى iOS XCFramework. يمكن لمستخدمي Linux تنزيل الإصدارات لـ Ubuntu عبر الخلفيات CPU وVulkan وROCm 7.2 وOpenVINO وSYCL. يتضمن دعم Windows متغيرات CPU وCUDA 12.4 و13.3 وVulkan وOpenVINO وSYCL وHIP. كما تدعم منصات إضافية مثل Android arm64 وopenEuler مع تكوينات الأجهزة المحددة.

lab OpenAI News · منذ 7 يوم

أبحاث OpenAI تُظهر أن وكلاء الذكاء الاصطناعي يُغيّرون طبيعة العمل

تُظهر ورقة بحثية جديدة من OpenAI كيف أن وكلاء الذكاء الاصطناعي يغيّرون جذرياً طبيعة العمل. تسلط الدراسة الضوء على قدرة هذه الوكلاء على تنفيذ مهام أطول وأكثر تعقيداً مما كان ممكناً سابقاً. يُعزى هذا التقدم التكنولوجي إلى توسيع الإنتاجية عبر مجموعة واسعة من الأدوار المهنية. تشير النتائج إلى تحول كبير في كيفية تنظيم العمل وأدائه من خلال الأتمتة. ومن خلال التعامل مع سير العمل المعقد، يمكّن وكلاء الذكاء الاصطناعي المستخدمين من تحقيق كفاءة أكبر. تُعد الورقة دليلاً على التأثير المتزايد للأنظمة المستقلة على التوظيف الحديث.

media Hugging Face Forums · منذ 7 يوم

Bro77XP تطلق VTuber ذكاء اصطناعي محلي سهل للمبتدئين مع استنساخ صوتي Zero-Shot

أصدرت Bro77XP مشروع VTuber بالذكاء الاصطناعي يعمل محليًا بنسبة 100% ومجاني، مصمم للمبتدئين وغير المبرمجين. يستخدم النظام Whisper للتعرف على الكلام الإنجليزي في الوقت الفعلي، وOllama مع نموذج llama3.2 للاستنتاج اللغوي (LLM)، وChatterbox TTS لتوليد الكلام من النص. يتميز بميزة استنساخ الصوت فوري Zero-Shot ويعمل في حلقة استماع مستمرة تكتشف الصمت تلقائيًا لتسجيل الكلام فقط عند وجوده. يتكامل البرنامج مع VTube Studio عبر واجهة برمجة التطبيقات (API) للتحكم في تعبيرات الفم وتشغيل رسوم متحركة للعواطف بناءً على الاستجابات المولدة. وعلى الرغم من أنه تم تطويره في البداية على معالج رسومات AMD، فإن الكود يدعم بشكل أساسي مستخدمي وحدة المعالجة المركزية (CPU)، مما يسمح بالعمل دون حاجة إلى عتاد NVIDIA أو AMD محدد. يتطلب الإعداد Python 3.10.11 ويتضمن إنشاء بيئة افتراضية لتثبيت التبعيات الأساسية مثل openai-whisper وpyaudio وwebsocket-client.

github llama.cpp · منذ 7 يوم

إصلاح حالات اختبار الوحدات الفاشلة لـ conv_3d في SYCL

قام مستودع llama.cpp بمعالجة مشكلة محددة تتعلق بالخلفية (backend) الخاصة بـ SYCL. تم تقديم طلب سحب (pull request) لإصلاح حالات اختبار الوحدات الفاشلة المرتبطة بعملية conv_3d. يستهدف هذا التحديث مشروع ggml-org/llama.cpp على GitHub. تحل التغييرات الأخطاء التي كانت تمنع سابقاً التنفيذ الناجح لهذه الاختبارات. يضمن هذا الإصلاح استقراراً أفضل للمستخدمين الذين يعتمدون على تسريع الأجهزة القائم على SYCL.

github llama.cpp · منذ 7 يوم

إصدار llama.cpp b9786 يضيف دعم صفوف غير متجاورة عبر OpenCL

أطلق مشروع llama.cpp الإصدار b9786، الذي يقدم دعمًا للصفوف غير المتجاورة في التطبيع عبر OpenCL. يُعد هذا التحديث جزءًا من التطوير المستمر الذي تقوم به فريق ggml-org لتعزيز توافق الأجهزة والأداء عبر منصات مختلفة. يوفر الإصدار ثنائيات (binaries) لنظام macOS على شرائح Apple Silicon وMac بمعالجات Intel، وإطارات عمل XCFrameworks لنظام iOS. يمكن لمستخدمي Linux الوصول إلى التجميعات لأنظمة Ubuntu x64 وarm64 وs390x باستخدام backends المعتمدة على CPU وVulkan وROCm 7.2 وOpenVINO وSYCL. يتوفر دعم Android لأجهزة arm64 CPU، بينما يقدم Windows خيارات واسعة تشمل CPU وCUDA 12 و13 وVulkan وOpenVINO وSYCL وHIP. يذكر الإصدار أيضًا التجميعات المعطلة لـ KleidiAI على منصات macOS وopenEuler.

media Hugging Face Forums · منذ 8 يوم

Niodoo: وقت تشغيل محلي لتوجيه الحالة المخفية لنماذج اللغات الكبيرة المجمدة

أطلق جيسون فان فام أداة Niodoo، وهي وقت تشغيل محلي مصمم لتوجيه نماذج اللغات الكبيرة (LLM) المجمدة من خلال حالاتها المخفية. يهدف المشروع إلى تصحيح أخطاء الخطوة الأخيرة عن طريق حقن الضوضاء أو "قوى فيزيائية" أثناء الاستدلال لكسر حلقات الرموز. يتيح هذا النهج للنماذج الأصغر تحسين الأداء دون ضبط دقيق، مستهدفاً حالات فشل محددة مثل معيار موجه الفراولة الخاص بـ Llama. يولد النظام علامات قياس عن بُعد خاصة به ويستخدم تحليل TDA لمراقبة الحالات الداخلية للنموذج للكشف عن سلوك الحلقة. طور فان فام هذه الأداة بشكل عضوي من خلال أشهر من البحث الموجه ذاتياً واختبار الاختراق، مع التأكيد على نتائج قابلة للتكرار من تجزئات ثابتة. الكود متاح على GitHub تحت المستودع Ruffian-L/niodoo-hidden-state-steering.

media Hugging Face Forums · منذ 8 يوم

مستخدمون يبلغون عن عدم توفر الأداة وخادم MCP لنموذج Step 3.7 Flash على HuggingChat

أبلغ مستخدم في منتديات Hugging Face أن نموذج Step 3.7 Flash فقد القدرة على استخدام الأدوات والاتصال بخوادم MCP بدءاً من ذلك الصباح. أعرب الكاتب عن رضاه القوي تجاه أداء النموذج، مشيراً إلى جودته العالية مقارنة باستهلاكه المنخفض للموارد وتكلفته. شدد المستخدم على رغبته في الاستمرار في استخدام هذا النموذج المحدد بدلاً من الانتقال إلى بدائل أخرى بسبب كفاءته. سأل المستخدم صراحة عما إذا كان فقدان هذه الوظائف دائماً وهل هناك أي خطوات يمكن اتخاذها لاستعادة الوصول. يسلط المنشور الضوء على قلق المجتمع بشأن الانقطاع المفاجئ لقدرات الأدوات لنموذج شائع وفعال من حيث التكلفة.

media Hugging Face Forums · منذ 8 يوم

استفسار عن تنسيق المطالبة لتدريب Unsloth/Phi-3.5-mini-instruct

يسعى مستخدم للحصول على نصائح حول استراتيجية تنسيق المطالبات المثلى لتدريب نموذج Phi-3.5-mini-instruct باستخدام Unsloth. تقارن الاستفسار بين الحفاظ على تنسيق نص مخصص مقابل استخدام قالب محادثة قياسي لتحضير مجموعة البيانات. تستخدم التنفيذ الحالي دالة تقوم ببنية البيانات إلى أقسام '### Input:' و '### Output:'، مع إضافة رمز نهاية النص. يعالج هذا النهج حقول الإدخال والإخراج المشفرة بتنسيق JSON المستمدة من كائن Hugging Face Dataset. يوضح المثال المقدم بنية معقدة تتضمن رؤى مالية وأسماء التجار والتواريخ وإجماليات المعاملات. ينوي المستخدم نشر النموذج المدرب عبر واجهة برمجة تطبيقات مخصصة ويطلب إرشادات حول ما إذا كان يجب الاحتفاظ بهذا التنسيق أو الانتقال إلى قالب محادثة.

github llama.cpp · منذ 8 يوم

إصدار llama.cpp b9785 مع فحص مقوى للقيم القصوى وثنائيات متعددة المنصات

أطلق مشروع llama.cpp الإصدار b9785، والذي يتضمن تغييرًا في الكود لتقوية فحوصات القيم القصوى كما هو مفصل في طلب السحب #24973. يوفر هذا التحديث ثنائيات جاهزة للبناء لأنظمة macOS Apple Silicon وMac Intel وiOS عبر XCFramework، مع تعطيل دعم KleidiAI على Apple Silicon. تُدعم توزيعات Linux بما في ذلك Ubuntu لكل من backends المعالج المركزي (CPU) وVulkan وROCm 7.2 وOpenVINO وSYCL عبر بنية x64 وarm64 وs390x. يمكن لمستخدمي Android الوصول إلى ثنائيات arm64 للمعالج المركزي، بينما يوفر Windows خيارات واسعة تغطي CPU وOpenCL Adreno وCUDA 12 و13 وVulkan وOpenVINO وSYCL وHIP. يتضمن الإصدار أيضًا عمليات بناء لنظام openEuler تستهدف معالجات x86 وaarch64 مع دعم ACL Graph. تتوفر حزمة واجهة مستخدم مستقلة إلى جانب الإصدارات الخاصة بكل منصة لتسهيل الاستدلال المحلي للنماذج.

media Hugging Face Forums · منذ 8 يوم

مستخدم يبلغ عن قيام HuggingFace بفرض رسوم على حوسبة L40S غير المستخدمة في المساحات

أبلغ مستخدم في منتدى مناقشة Hugging Face عن مشكلة حيث بقي مساحته عالقة في مرحلة البدء أثناء استخدام GPU من نوع L40S. أعرب المستخدم عن إحباطه لأنه كان يُفرض عليه رسوم لموارد الحوسبة على الرغم من فشل التطبيق في الإقلاع أو استخدام أي قوة معالجة فعلية. تسلط هذه الحادثة الضوء على مخاوف تتعلق بشفافية الفوترة وموثوقية البنية التحتية داخل بيئة المساحات (Spaces) للمنصة. يعمل المنشور كشكوى بشأن الخسارة المالية بسبب الأعطال التقنية بدلاً من أن يكون إعلاناً عن ميزة جديدة. لم يتم تضمين أي تفاصيل تقنية إضافية أو ردود رسمية في محتوى المصدر المقطوع.

media Hugging Face Forums · منذ 8 يوم

مستخدمون يبلغون عن فشل الوصول إلى أداة Step 3.7 Flash على HuggingChat

أبلغ مستخدم في منتدى مناقشة Hugging Face أن نموذج Step 3.7 Flash من StepFun AI فقد قدرته على استخدام الأدوات، بما في ذلك خوادم MCP، اعتباراً من صباح نشر التقرير. أعرب الفرد عن قلقه بشأن ما إذا كان هذا الانقطاع مؤقتاً أم دائماً، مشيراً إلى تفضيله القوي لهذا النموذج المحدد بسبب أدائه العالي وتكاليف الموارد المنخفضة مقارنة بالمنافسين. وعلى الرغم من إطرائه لجودة النموذج وسعره المعقول، سلط المستخدم الضوء على الاضطراب الفوري الناجم عن عدم القدرة على تنفيذ الوظائف القائمة على الأدوات. يسعى المنشور إلى الحصول على توضيحات من المجتمع حول التجارب السابقة مع مشكلات مماثلة والحلول المحتملة. يسلط هذا الحادث الضوء على اعتماد حاسم على توفر الأدوات للمستخدمين الذين يعتمدون على هذا التكوين المحدد للذكاء الاصطناعي.

media Hugging Face Forums · منذ 8 يوم

القلب الميتافيزيائي: عكس المفاهيم العاطفية لنماذج اللغات الكبيرة عبر كسب سلبي

يقدم المؤلف مفهوم 'القلب الميتافيزيائي'، وهي تقنية مصممة لتوسيع طبيعة الاستنتاج أحادية الاتجاه لنماذج اللغات الكبيرة. تتيح هذه الطريقة للنماذج التقاط مفاهيم دقيقة ومتعددة الأوجه، مثل الذكريات التي تثير الحزن والفرح في آن واحد. تم تطوير هذا النهج عن طريق تطبيق عامل كسب سلبي أثناء المسوحات داخل بنية التوجيه Niodoo. يعالج هذا القيد الشائع حيث تتكيف نماذج اللغات الكبيرة بشكل مفرط مع العواطف الأحادية عند الاستفسار عن تجارب شخصية. من خلال عكس المفاهيم بطريقة مشابهة للانكماش الفيزيائي، تتيح التقنية للنماذج عكس الحالات العاطفية، مثل تحويل الذكريات الحزينة إلى سعيدة. تم مشاركة العمل عبر مستودع GitHub بعنوان 'ontological-inversion' بواسطة المستخدم Ruffian-L.