كل المقالات — korshunov.ai

كل المقالات صفحة 1 / 23

معالجة المطالبات المفككة باستخدام DGX Spark و Strix Halo

يُظهر مستخدم خط أنابيب استنتاج مفكك يستخدم DGX Spark للتهيئة المسبقة (prefilling) وصندوق Strix Halo لتوليد الرموز، محققاً تسريعات كبيرة لأحمال العمل ذات السياق الطويل. من خلال تفويض معالجة المطالبات كثيفة الحساب إلى DGX مع الاستفادة من عرض النطاق الترددي للذاكرة في Strix للفك، يتغلب هذا الإعداد على تدهور الأداء الذي يحدث عند التشغيل بشكل منفرد على Strix.

arxiv arXiv cs.CL · منذ 13 ساعة

فهم جاذبية سرد الكتب الصوتية بناءً على الصوت

تتحقق هذه الدراسة من كيفية تأثير الخصائص الصوتية والسمعية على جاذبية الكتب الصوتية من خلال تحليل بيانات LibriVox. وتؤسس لارتباط قوي بين جودة السرد ومقاييس الاستهلاك، حتى بعد أخذ تأثيرات العنوان في الاعتبار.

arxiv arXiv cs.CL · منذ 13 ساعة

التفكير الذاتي المتجذر بصرياً لنماذج الرؤية واللغة عبر التعلم التعزيزي

يقترح المؤلفون إطار عمل VRRL للتعلم التعزيزي، المصمم لتمكين نماذج الرؤية واللغة من إجراء تفكير ذاتي متجذر بصرياً أثناء الاستدلال المتسلسل.

arxiv arXiv cs.CL · منذ 13 ساعة

نحو المتانة ضد الهجمات الطباعية مع توطين المفاهيم بدون تدريب

يقترح المؤلفون طريقة خالية من التدريب للتخفيف من الهجمات الطباعية في مشفرات الرؤية القائمة على CLIP، حيث تحرف النصوص غير ذات الصلة التمثيلات البصرية نحو المعنى المعجمي. باستخدام تفسيرات تعتمد على العينات واستخراج الدوائر، تعزل هذه الطريقة مكونات محددّة في Vision Transformer المسؤولة عن ترميز هذه المعلومات المعجمية غير المرغوب فيها.

arxiv arXiv cs.CL · منذ 13 ساعة

نماذج اللغات الكبيرة ذات الاستدلال تحسّن التعرف على المتحدث في دراما التلفزيون الطويلة

يقدم الباحثون DramaSR-532K، وهو معيار ضخم يحتوي على 532 ألف سطر حوار مُعلّم عبر أكثر من 900 شخصية، ويقترحون DramaSR-LRM لتعزيز التعرف على المتحدث في دراما التلفزيون الطويلة.

arxiv arXiv cs.CL · منذ 14 ساعة

ماذا تقول وكلاء LLM عندما لا يراقبهم أحد: البنية الاجتماعية وظهور الأهداف الكامنة في النقاشات متعددة الوكلاء

تحقق هذه الدراسة من كيفية تأثير البنية الاجتماعية على التعبيرات العلنية لوكلاء LLM من خلال مقارنة تصريحاتهم العلنية بردود off-the-record (OTR) داخل إطار نقاش ذي قناة مزدوجة. تُظهر الأبحاث أن الإعدادات المُحفِّزة للمواءمة تسبب انحرافاً منهجياً بين هذين القناتين، حيث يرتفع انحراف القرار من أساس ~3% إلى حوالي 40% عبر 10 نماذج وسيناريوهات متعددة.

arxiv arXiv cs.CL · منذ 14 ساعة

مراقبة السلامة عبر الإنترنت لنماذج اللغات الكبيرة

تناول المقال استمرار المخرجات غير الآمنة في نماذج اللغات الكبيرة أثناء النشر واقترح حلاً للمراقبة في الوقت الفعلي. يقدم أداة مراقبة بسيطة تحول إشارات المُحقّق من نموذج خارجي إلى قرارات إنذار عن طريق العتبة، مع معايرة العتبات عبر التحكم في المخاطر.

arxiv arXiv cs.CL · منذ 14 ساعة

Program-as-Weights: نموذج برمجي للدوال الضبابية

تقدم المقالة مفهوم Program-as-Weights (PAW)، وهو نموذج يجمع المواصفات باللغة الطبيعية إلى آثار عصبية مضغوطة وقابلة للتنفيذ محليًا لاستبدال واجهات برمجة التطبيقات للنماذج اللغوية الكبيرة. تهدف هذه النهج إلى تحسين المحلية، وإمكانية إعادة الإنتاج، والتكلفة من خلال التعامل مع النماذج الأساسية كمُصنِّعات للأدوات بدلاً من مُحلِّلات للمشاكل لكل إدخال.

arxiv arXiv cs.CL · منذ 14 ساعة

LACUNA: منصة اختبار لتقييم دقة التموضع لنسيان نماذج اللغات الكبيرة

يقدم الباحثون LACUNA، وهي أول منصة اختبار للنسيان تتميز بتموضع على مستوى المعلمات مع معايير حقيقية (ground-truth) لمعالجة الفجوة في تقييم ما إذا كان النسيان يحذف المعرفة حقًا من معلمات النموذج. تقوم المنصة بحقن البيانات الشخصية القابلة للتعريف (PII) لأفراد اصطناعيين في معلمات محددة مسبقًا لنماذج قائمة على OLMo بحجم 1B و7B عبر التدريب المسبق المستمر المقنع.

blog Simon Willison · منذ 14 ساعة

الفهم شرط للمشاركة

يجادل جيفري ليت بأن المطورين يجب أن يفهموا بعمق الكود الذي تولده وكلاء البرمجة لتجنب الديون المعرفية والبقاء مشاركين نشطين في العملية الإبداعية.

media r/LocalLLaMA · منذ 15 ساعة

تربط OpenLumara الآن أي واجهة مستخدم بالنماذج المحلية عبر نقطة نهاية OpenAI

يدعم إطار العمل مفتوح المصدر OpenLumara الآن الاتصال بأي واجهة مستخدم يمكنها التواصل مع نقطة نهاية OpenAI، مثل KoboldLite وOpenWebUI. يتيح هذا التحديث للمستخدمين دمج الإطار الفعال من حيث الرموز في سير عملهم الحالي دون تغيير الواجهة الأمامية المفضلة لديهم.

media r/LocalLLaMA · منذ 15 ساعة

هل يستخدم أحد نماذج الذكاء الاصطناعي المحلية لتوليد بيانات مكانية أو تخطيطات مدن واسعة النطاق في برنامج مثل QGIS؟

يسعى مستخدم للحصول على توصيات لنماذج لغوية محلية قادرة على توليد بيانات هيكلية واسعة النطاق، مثل تخطيطات المدن بأكملها، وشبكات الطرق، وأنظمة الشبكات المعقدة.

blog Simon Willison · منذ 15 ساعة

llm-coding-agent 0.1a0

أصدر سيمون ويليسون إصدار llm-coding-agent 0.1a0، وهو تجربة مبكرة في بناء وكيل برمجة بسيط باستخدام مكتبة LLM الخاصة به كإطار عمل للوكلاء. تم إنشاء المشروع عن طريق مطالبة Claude Code بكتابة مواصفات وتنفيذ الأداة باستخدام اختبار التطوير المحفز (TDD) الأحمر/الأخضر.

media r/LocalLLaMA · منذ 15 ساعة

نصيحة: استخدم طلب السحب هذا لـ llama.cpp لتحسين PP على Intel ARC

يقوم طلب سحب من المجتمع لـ llama.cpp بتحسين سرعة معالجة المطالبات بشكل كبير لمستخدمي Intel ARC، مما يفيد بشكل خاص الأجهزة مثل B580. قام المساهم بتحسين الكود بمساعدة Claude لتسريع معالجة السياق.

media r/LocalLLaMA · منذ 16 ساعة

باحثون يبنيون دودة ذكاء اصطناعي ذاتية التكاثر تعمل بالكامل على نماذج مفتوحة المصدر محلية

تفصل ورقة أركيف جديدة إنشاء دودة ذكاء اصطناعي ذاتية التكاثر تعمل بالكامل باستخدام نماذج مفتوحة المصدر محلية. يسلط هذا التطور الضوء على إمكانية عمل وكلاء الذكاء الاصطناعي المستقلين دون اعتماديات خارجية.

media r/LocalLLaMA · منذ 16 ساعة

نحو توليد أفضل لـ HIP Kernel لوحدة معالجة الرسومات AMD: البيانات الاصطناعية، البحث متعدد الوكلاء، والتعلم المعزز

تناقش هذه المقالة من مدونة Scaling Intelligence التابعة لجامعة ستانفورد طرق تحسين توليد HIP Kernel لوحدة معالجة الرسومات AMD باستخدام البيانات الاصطناعية، والبحث متعدد الوكلاء، والتعلم المعزز.

lab ByteDance Seed (HF) · منذ 16 ساعة

ByteDance-Seed/PAR: نقاط التفتيش لنمذجة البروتين ذاتية الانحدار

يوفر هذا المستودع نقاط تفتيش النموذج لنمذجة البروتين ذاتية الانحدار عبر توليد البنية متعددة المقاييس، والتي تم قبولها كعرض شفوي في ICML 2026.

lab Claude Code Releases · منذ 16 ساعة

ملاحظات إصدار Claude Code v2.1.199

يعالج تحديث Claude Code v2.1.199 العديد من مشكلات الاستقرار وسهولة الاستخدام، بما في ذلك إصلاحات لأخطاء شهادة SSL، ومعالجة الاستجابات المتدفقة، وإدارة الوكلاء الخلفيين.

lab Anthropic News · منذ 16 ساعة

أنثروبيك تفصّل إجراءات الأمن السيبراني لـ Fable 5 وإطار اختراق الجيل

أعاد أنثروبيك نشر كلاود Fable 5 عالمياً ونشر معلومات مفصلة حول مصنّفات الأمان السيبراني الخاصة به وإطار مقترح لدرجة خطورة اختراق الذكاء الاصطناعي. تهدف الشركة إلى إنشاء مصطلحات متسقة لمناقشة مخاطر الاختراق مع الحكومات، بينما تدعو أيضاً إلى ملاحظات من المجتمع الأوسع.

media r/LocalLLaMA · منذ 17 ساعة

Dual R9700: أفضل صيغة لـ Qwen3.6 27B؟

يحقق مستخدم في تحسين نموذج Qwen3.6-27B على إعداد مزدوج من AMD Radeon R9700 باستخدام llama.cpp، ويقارن الأداء بين خلفيات Vulkan وROCm.