كل المقالات — korshunov.ai

كل المقالات صفحة 1 / 22

معالجة المطالبات المفككة باستخدام DGX Spark و Strix Halo

يُظهر مستخدم خط أنابيب استنتاج مفكك يستخدم DGX Spark للتهيئة المسبقة (prefilling) وصندوق Strix Halo لتوليد الرموز، محققاً تسريعات كبيرة لأحمال العمل ذات السياق الطويل. من خلال تفويض معالجة المطالبات كثيفة الحساب إلى DGX مع الاستفادة من عرض النطاق الترددي للذاكرة في Strix للفك، يتغلب هذا الإعداد على تدهور الأداء الذي يحدث عند التشغيل بشكل منفرد على Strix.

blog Simon Willison · منذ 5 ساعة

الفهم شرط للمشاركة

يجادل جيفري ليت بأن المطورين يجب أن يفهموا بعمق الكود الذي تولده وكلاء البرمجة لتجنب الديون المعرفية والبقاء مشاركين نشطين في العملية الإبداعية.

media r/LocalLLaMA · منذ 6 ساعة

تربط OpenLumara الآن أي واجهة مستخدم بالنماذج المحلية عبر نقطة نهاية OpenAI

يدعم إطار العمل مفتوح المصدر OpenLumara الآن الاتصال بأي واجهة مستخدم يمكنها التواصل مع نقطة نهاية OpenAI، مثل KoboldLite وOpenWebUI. يتيح هذا التحديث للمستخدمين دمج الإطار الفعال من حيث الرموز في سير عملهم الحالي دون تغيير الواجهة الأمامية المفضلة لديهم.

media r/LocalLLaMA · منذ 6 ساعة

هل يستخدم أحد نماذج الذكاء الاصطناعي المحلية لتوليد بيانات مكانية أو تخطيطات مدن واسعة النطاق في برنامج مثل QGIS؟

يسعى مستخدم للحصول على توصيات لنماذج لغوية محلية قادرة على توليد بيانات هيكلية واسعة النطاق، مثل تخطيطات المدن بأكملها، وشبكات الطرق، وأنظمة الشبكات المعقدة.

blog Simon Willison · منذ 6 ساعة

llm-coding-agent 0.1a0

أصدر سيمون ويليسون إصدار llm-coding-agent 0.1a0، وهو تجربة مبكرة في بناء وكيل برمجة بسيط باستخدام مكتبة LLM الخاصة به كإطار عمل للوكلاء. تم إنشاء المشروع عن طريق مطالبة Claude Code بكتابة مواصفات وتنفيذ الأداة باستخدام اختبار التطوير المحفز (TDD) الأحمر/الأخضر.

media r/LocalLLaMA · منذ 6 ساعة

نصيحة: استخدم طلب السحب هذا لـ llama.cpp لتحسين PP على Intel ARC

يقوم طلب سحب من المجتمع لـ llama.cpp بتحسين سرعة معالجة المطالبات بشكل كبير لمستخدمي Intel ARC، مما يفيد بشكل خاص الأجهزة مثل B580. قام المساهم بتحسين الكود بمساعدة Claude لتسريع معالجة السياق.

media r/LocalLLaMA · منذ 6 ساعة

باحثون يبنيون دودة ذكاء اصطناعي ذاتية التكاثر تعمل بالكامل على نماذج مفتوحة المصدر محلية

تفصل ورقة أركيف جديدة إنشاء دودة ذكاء اصطناعي ذاتية التكاثر تعمل بالكامل باستخدام نماذج مفتوحة المصدر محلية. يسلط هذا التطور الضوء على إمكانية عمل وكلاء الذكاء الاصطناعي المستقلين دون اعتماديات خارجية.

media r/LocalLLaMA · منذ 7 ساعة

نحو توليد أفضل لـ HIP Kernel لوحدة معالجة الرسومات AMD: البيانات الاصطناعية، البحث متعدد الوكلاء، والتعلم المعزز

تناقش هذه المقالة من مدونة Scaling Intelligence التابعة لجامعة ستانفورد طرق تحسين توليد HIP Kernel لوحدة معالجة الرسومات AMD باستخدام البيانات الاصطناعية، والبحث متعدد الوكلاء، والتعلم المعزز.

lab ByteDance Seed (HF) · منذ 7 ساعة

ByteDance-Seed/PAR: نقاط التفتيش لنمذجة البروتين ذاتية الانحدار

يوفر هذا المستودع نقاط تفتيش النموذج لنمذجة البروتين ذاتية الانحدار عبر توليد البنية متعددة المقاييس، والتي تم قبولها كعرض شفوي في ICML 2026.

lab Claude Code Releases · منذ 7 ساعة

ملاحظات إصدار Claude Code v2.1.199

يعالج تحديث Claude Code v2.1.199 العديد من مشكلات الاستقرار وسهولة الاستخدام، بما في ذلك إصلاحات لأخطاء شهادة SSL، ومعالجة الاستجابات المتدفقة، وإدارة الوكلاء الخلفيين.

lab Anthropic News · منذ 7 ساعة

أنثروبيك تفصّل إجراءات الأمن السيبراني لـ Fable 5 وإطار اختراق الجيل

أعاد أنثروبيك نشر كلاود Fable 5 عالمياً ونشر معلومات مفصلة حول مصنّفات الأمان السيبراني الخاصة به وإطار مقترح لدرجة خطورة اختراق الذكاء الاصطناعي. تهدف الشركة إلى إنشاء مصطلحات متسقة لمناقشة مخاطر الاختراق مع الحكومات، بينما تدعو أيضاً إلى ملاحظات من المجتمع الأوسع.

media r/LocalLLaMA · منذ 8 ساعة

Dual R9700: أفضل صيغة لـ Qwen3.6 27B؟

يحقق مستخدم في تحسين نموذج Qwen3.6-27B على إعداد مزدوج من AMD Radeon R9700 باستخدام llama.cpp، ويقارن الأداء بين خلفيات Vulkan وROCm.

media r/LocalLLaMA · منذ 8 ساعة

أنوية WebGPU لـ Gemma 4 تحقق 255 توكن/ثانية

أصدرت Xenova أنوية WebGPU لـ Gemma 4، محققة أداءً يبلغ 255 توكن في الثانية. يتيح هذا التحسين تشغيل النماذج الكثيفة بسرعات تتجاوز 100 تيرابايت/ثانية في متصفحات الويب.

blog Simon Willison · منذ 8 ساعة

استخدام DSPy لتقييم وتحسين أوامر النظام SQL لوكيل Datasette

استخدم سيمون ويليسون Claude Code مع نموذج Fable 5 لأتمتة تقييم وتحسين أوامر النظام لوكيل Datasette، مستهدفاً بشكل خاص ميزة تنفيذ استعلامات SQL للقراءة فقط. تضمنت العملية تثبيت أحدث إصدار تجريبي من Datasette وDSPy لتحديد نقاط الضعف في كيفية تعامل الوكيل مع معلومات المخطط.

media r/LocalLLaMA · منذ 8 ساعة

رائد الذكاء الاصطناعي في إنفيديا يرفض الذكاء العام الاصطناعي، ومقارنة أوبن إيه آي وأنثروبيك بـ AOL

صرح شخصية بارزة من إنفيديا بأنه لا يؤمن بالذكاء العام الاصطناعي (AGI)، ويؤكد أن تركيز الصناعة يجب أن يتحول نحو نماذج مفتوحة المصدر مخصصة للشركات.

media r/LocalLLaMA · منذ 9 ساعة

معايير محلية باستخدام RTX 3090 - Qwen3.6 27b مقابل Ornith

قارن مستخدم بين Qwen3.6 27b وGemma4 26B A4B QAT وOrnith1.0 35B MoE باستخدام إطار عمل inspect-ai على RTX 3090 لتقييم أداء النماذج محليًا. أظهرت النتائج نتائج مختلطة عبر معايير المعرفة العامة، والتوجيه، والبرمجة، حيث كان Qwen3.6 يتصدر عمومًا في الدرجات بينما أظهر Ornith نقاط قوة في مجالات محددة مثل DROP.

media r/LocalLLaMA · منذ 9 ساعة

مستخدم يوسع نموذج Gemma 4 31B إلى نموذج 44B بـ 88 طبقة

قام مستخدم على Reddit بتوسيع نموذج Google Gemma 4 31B، الذي يحتوي على 60 طبقة، إلى إصدار أكبر بـ 44 مليار معلمة يتضمن 88 طبقة. تم إجراء هذا التعديل لأن Google لم تطلق إصدارًا كثيفًا أكبر من النموذج للاستخدام على Lyzr Architect.

media Hugging Face Forums · منذ 9 ساعة

تشبع الأدلة k*: يجب معايرة عمق الاسترجاع وليس تخمينه

تجربة معيارية أولية حول عمق الأدلة لاستدعاءات نماذج اللغات الكبيرة تجادل بأن المعايرة يجب أن تمتد إلى ما وراء الدقة الواقعية لتشمل التلوث المعرفي وتسرب الإطارات. تعرف الدراسة على 'k*' بأنه نقطة تشبع الأدلة حيث يتم تعظيم الموثوقية، مما يميزها عن مقاييس top-k القياسية أو كثافة الحالة.

media Hugging Face Forums · منذ 10 ساعة

اختبار الإجهاد المعرفي — تم التحقق من Claude Sonnet 5 بواسطة MarCognity-AI

تصف المقالة عملية التحقق من Claude Sonnet 5 باستخدام الوكيل المتشكك (Skeptical Agent) التابع لـ MarCognity-AI لكشف الفجوة بين الثقة النصية والقابلية الفعلية للتحقق، وهو ما يُسمى "الانقسام المعرفي".

media Hugging Face Forums · منذ 10 ساعة

إطار عمل Aiywin يقترح التكرار الحلزوني لاستدلال الذكاء الاصطناعي

يقدم المطور المستقل Aiywin.ai إطارًا معرفيًا يحل المعالجة الخطية القياسية بحلقات التكرار الحلزوني للتعامل مع الشذوذ والبيانات غير المكتملة. يقوم النظام بتوسيع المعلمات السياقية رياضيًا حتى يتم العثور على حل منظم، بدلاً من التوقف أو الهلوسة.