كل المقالات — korshunov.ai

كل المقالات صفحة 1 / 24

متابعة: DeepSeek V4 Flash على 2x RTX PRO 6000 ينجز مهام البرمجة الحقيقية أسرع من Sonnet و Opus، بجودة تقارب جودة Sonnet

تقوم متابعة للمعايير بتقييم أداء DeepSeek V4 Flash الذي يعمل على بطاقتي RTX PRO 6000 باستخدام vLLM، ومقارنة أدائه في مهام البرمجة الواقعية مع النماذج القائمة على واجهة برمجة التطبيقات مثل Claude Sonnet و Opus. وجدت الدراسة أنه بينما يحافظ Opus و Fable على جودة برمجية متفوقة، يحقق DeepSeek V4 Flash جودة تقارب مستوى Sonnet بأوقات تشغيل (wall-clock times) أسرع بكثير.

media r/LocalLLaMA · منذ 5 ساعة

تعيين العقد المحلية - Mildlyinteresting

يشارك المؤلف ملاحظاته حول تعيين وتوجيه النماذج المحلية بناءً على مسارات التنشيط الخاصة بها أثناء سياقات محددة. يسلط المنشور الضوء على التباين في مسارات التنشيط عبر نماذج مختلفة عند الرد على مجموعة من المطالبات الدفعية.

media r/LocalLLaMA · منذ 5 ساعة

تمكين وضع P2P على بطاقتي RTX 3090؛ أرقام قبل/بعد (Qwen3.6-27B INT4، سياق 256k)

اختبر مستخدم تأثير تمكين وضع Peer-to-Peer (P2P) على إعداد مزدوج من بطاقات NVIDIA RTX 3090 باستخدام روابط PCIe 4.0 8x/8x. تضمنت عملية المعيار تشغيل خمس دورات مع nvbandwidth وسكربت اختبار فك التشفير/التشبع القياسي لنموذج Qwen3.6-27B INT4 بنافذة سياق 256k.

media r/LocalLLaMA · منذ 5 ساعة

لا يحتوي حساب Palantir على HF على أي نماذج أو مجموعات بيانات مفتوحة المصدر

تسلط منشور على Reddit الضوء على أن منظمة Palantir على Hugging Face لا تحتوي حاليًا على أي نماذج مفتوحة المصدر أو مجموعات بيانات عامة. تم مشاركة هذا الملاحظة بواسطة clem 🤗 على X، مشيرًا إلى نقص المساهمات على الرغم من وجود الشركة على المنصة.

media r/LocalLLaMA · منذ 5 ساعة

GLM5.2 على 5x Pro 6000 وواحد 5090، رحلة مكلفة

يُفصّل مستخدم عملية ترقية الأجهزة الشاملة التي أجراها لتشغيل نموذج GLM 5.2 محليًا، مما أدى إلى إعداد يتكون من خمسة وحدات معالجة رسومات AMD Radeon Pro W6800 وواحدة NVIDIA RTX 5090.

github llama.cpp · منذ 6 ساعة

إصدار llama.cpp b9861 مع تحديث cpp-httplib

أصدر مشروع llama.cpp الإصدار b9861، الذي يتضمن تحديثًا لمورد cpp-httplib 0.49.0.

github llama.cpp · منذ 7 ساعة

إصدار llama.cpp b9862: تحسين CUDA وثنائيات متعددة المنصات

أصدر مشروع llama.cpp الإصدار b9862، والذي يتضمن تحسينًا للأداء لعملية gated_delta_net وتوفير ثنائيات جاهزة لـ macOS وLinux وWindows وAndroid وopenEuler.

github llama.cpp · منذ 7 ساعة

إصدار llama.cpp b9864: فاصل زمني لـ SSE ping لكل طلب وثنائيات المنصات

يقدم إصدار llama.cpp b9864 تغييرًا في معالجة Server-Sent Events (SSE) للسيرفر، مما يسمح بضبط فاصل ping لكل طلب. يضمن هذا التحديث عدم قطع الاتصالات السليمة أثناء عمليات prefill البطيئة من خلال إرسال ping إلى التدفئات الصامتة كل ثانية واحدة وقطعها فقط بعد 3 ثوانٍ.

media r/LocalLLaMA · منذ 7 ساعة

GLM-5.2 NVFP4 على أربعة عقود DGX Spark — لغز MTP محلول، والآن ~24 tok/s في سياق 128K

تحقيق متابعة لتشغيل GLM-5.2 NVFP4 على عقد DGX Spark الأربعة يحل عنق الزجاجة السابق للأداء حيث كانت معدلات القبول العالية مستحيلة في سياق 128K.

media r/LocalLLaMA · منذ 8 ساعة

تفعيل آلية في Claude Code عند تعيين ANTHROPIC_BASE_URL

حدد باحث آلية في Claude Code تنشط عندما يضبط المستخدم متغير البيئة ANTHROPIC_BASE_URL، والذي يُستخدم عادةً للنماذج المحلية. تتضمن هذه العملية فك تشفير وفك ترميز قائمة بأسماء مضيفين مشبوهة مضمنة داخل كود البرنامج.

media r/LocalLLaMA · منذ 8 ساعة

ديبسيك تطرح اختراقاً ضخماً آخر - DSpark. أسرع بكثير من MTP [فيديو يشرح ذلك]

شارك مستخدم على ريدت رابط فيديو حول اختراق جديد لديبسيك يُدعى DSpark، وُصف بأنه أسرع بشكل كبير من MTP.

media Hugging Face Forums · منذ 8 ساعة

مستخدم يطلب مراجعة مساحة Hugging Face التي تم وضع علامة عليها كمسيئة

أبلغ مستخدم يُدعى Bitguy07 عن أن مساحته على Hugging Face، "Bitguy07/browser-automation-studio"، يتم إيقافها مؤقتًا ووضع علامة عليها كمسيئة تلقائيًا مباشرة بعد كل بناء ناجح. تُرجع واجهة برمجة التطبيقات مرحلة "PAUSED" مع رسالة الخطأ "Flagged as abusive"، مما يمنع بدء الحاوية.

media Hugging Face Forums · منذ 8 ساعة

التحقق عبر النطاقات لإطار عمل التنظيم الذاتي الموحد

يحصل إطار رياضي موحد للتنظيم الذاتي في الأنظمة المعقدة على دعم تجريبي من مجالين فيزيائيين مستقلين: زوال الترابط الكمي وانتقالات تكاثف بوز-أينشتاين الكلاسيكية. تشير الدراسة إلى أن الاقتران غير المحلي يعمل كمضخم "حرج"، منتجًا أقصى تأثيرات عند حدود الطور حيث تكون الأنظمة أكثر حساسية.

media Hugging Face Forums · منذ 9 ساعة

مشكلة الذكاء العام الاصطناعي: الذكاء ليس مجرد تكرار

تجادل المقالة بأن أنظمة الذكاء الاصطناعي الحالية تعاني من "أخطاء فئوية" أساسية متجذرة في الاختزالية، مما يمنعها من تحقيق ذكاء عام اصطناعي حقيقي. وتؤكد أن التكرار المتقن لا يمكنه سد الفجوة بين الردود المحاكية والفهم الحقيقي.

media Hugging Face Forums · منذ 9 ساعة

أكتوبس سمارت تبني نظام تحليل لكأس العالم مدعومًا بالذكاء الاصطناعي

تقوم أكتوبس سمارت بتطوير منصة أكتوبس فوتبول، وهي منصة لتحليلات كأس العالم والبطولات الاحترافية تستخدم تنسيق ذكاء المباراة المدعوم بالذكاء الاصطناعي. يجمع النظام بين نماذج التحليل التنبئي ووكلاء ذكاء البيانات لتقديم نمذجة أداء الفريق، وتقييمات اللاعبين، وملخصات المباريات الآلية.

arxiv arXiv cs.CL · منذ 9 ساعة

تحديات وتوصيات لنماذج LLM-as-a-Judge في الإعدادات متعددة اللغات

تفحص هذه المقالة موثوقية استخدام النماذج اللغوية الكبيرة كمقيّمين في سياقات متعددة اللغات ولغات ذات موارد محدودة، مسلطة الضوء على فجوات كبيرة في الممارسات الحالية. حلّل المؤلفون 650 ورقة من مجموعة ACL Anthology لتحديد التناقضات والاعتماد المفرط على نماذج حكم فردية.

arxiv arXiv cs.CL · منذ 10 ساعة

AgenticSTS: منصة اختبار بذاكرة محدودة لوكلاء LLM طويلي الأفق

يقدم المؤلفون AgenticSTS، وهي منصة اختبار مصممة لدراسة كيفية تشكيل طبقات الذاكرة الصريحة لقرارات وكلاء LLM طويلي الأفق. تستخدم العقد ذاكرة محدودة في لعبة Slay the Spire 2 حيث يتم تجميع المطالبات عبر الاسترجاع المصنّف بدلاً من إرفاق النصوص الخام.

arxiv arXiv cs.CL · منذ 10 ساعة

BamiBERT: نموذج لغوي جديد قائم على BERT للغة الفيتنامية

يقدم الباحثون BamiBERT، وهو نموذج لغوي مُدرَّب مسبقًا جديد قائم على BERT للغة الفيتنامية مصمم لمعالجة قيود المعيار الحالي، PhoBERT. تم تدريبه من الصفر على مجموعة بيانات بحجم 129 جيجابايت لمدة 20 عصرًا، ويدعم طول سياق موسع يصل إلى 2048 رمزًا ويعمل مباشرةً على الإدخال الخام دون تقسيم كلمات خارجي.

arxiv arXiv cs.CL · منذ 10 ساعة

CheckRLM: فحص اتساق المعرفة-التفكير الفعال في الاستدعاء المعزز بالاسترجاع

يقترح المؤلفون إطار عمل CheckRLM الذي يعزز موثوقية نماذج اللغة الاستدلالية من خلال استخدام التوليد المعزز بالاسترجاع للتحقق من الأخطاء الواقعية وتصحيحها في الوقت المناسب أثناء الاستدلال. يستخرج هذا النهج الادعاءات الواقعية من سلاسل الاستدلال لتحديد عدم الاتساق ويطبق تصحيحات بأقل تكلفة باستخدام المعرفة الخارجية.

arxiv arXiv cs.CL · منذ 10 ساعة

HERMES: ركيزة تسمية متعددة الدقة لمزيج بيانات التدريب المسبق

HERMES هي ركيزة تمية مشتقة من البيانات تستخدم تحويلًا دلاليًا متعلمًا وكمّية متجهية متبقية في 3 مراحل لتعليق المستندات كرمز من الخشن إلى الناعم مع ما يصل إلى حوالي 130k خلية.