كل المقالات — korshunov.ai

كل المقالات صفحة 1 / 19

Together AI في ICML 2026: أبحاث حدودية عبر الطبقة الكاملة

تقدم Together AI تسعة أوراق بحثية في ICML 2026 تغطي الطبقة الكاملة لتطوير منصتها.

ScarfBench: تقييم وكلاء الذكاء الاصطناعي للهجرة بين أطر عمل جافا المؤسسية

تقدم هذه المقالة ScarfBench، وهو معيار مصمم لتقييم أداء وكلاء الذكاء الاصطناعي في ترحيل تطبيقات جافا المؤسسية بين أطر عمل مختلفة. تسلط الدراسة الضوء على تعقيد هجرة الأطر وتقترح طريقة تقييم موحدة لتقييم قدرات الوكلاء في هذا المجال.

github llama.cpp · منذ 2 يوم

إصدار llama.cpp b9850: إصلاحات لـ Qwen3 وثنائيات جديدة

يُقدم إصدار llama.cpp b9850 تحديثات لدعم نماذج محددة، بما في ذلك تسجيل موتر t_layer_inp لـ Qwen3Next، وإصلاح تعيين المدخلات في حلقة معالجة الطبقات، ومعالجة مشكلات DFLASH لـ qwen-coder-next. كما يضيف موترًا لتطبيع الانتباه في نموذج Qwen3.

lab Microsoft Research Blog · منذ 2 يوم

SkillOpt: مهارات الوكيل كمعاملات قابلة للتدريب

تقدم Microsoft Research أسلوب SkillOpt، الذي يعامل ملفات مهارات الوكيل كمعاملات قابلة للتدريب خارج نموذج هدف ثابت، محوّلًا التعديل اليدوي للمهارات إلى عملية تحسين خاضعة للرقابة. يحسّن هذا النهج موثوقية الوكيل واتساقه دون تحديث أوزان النموذج الأساسي.

lab Anthropic News · منذ 2 يوم

كلود ساينس، منصة ذكاء اصطناعي للعلماء، متاحة الآن

أطلقت أنثروبيك نسخة بيتا من كلود ساينس، وهي بيئة عمل بالذكاء الاصطناعي مصممة لدمج الأدوات العلمية المتفرقة في بيئة بحثية واحدة. تهدف المنصة إلى تسريع الاكتشافات من خلال توفير عناصر قابلة للمراجعة، وقدرات حوسبة قابلة للتوسع بمرونة، ووكلاء متخصصين لمجالات مثل الجينوميات والبيولوجيا الهيكلية.

lab Anthropic News · منذ 2 يوم

إطلاق Claude Sonnet 5

أطلقت Anthropic نموذج Claude Sonnet 5، وهو نموذج ذكاء اصطناعي وكيلي جديد مصمم لأداء مهام التخطيط المعقدة واستخدام الأدوات والبرمجة المستقلة بتكلفة أقل من نماذج الفئة Opus السابقة. يقلل التحديث من فجوة الأداء مع Opus 4.8 بينما يقدم تحسينات كبيرة في الاستدلال والسلامة والتنفيذ مقارنة بسلفه Sonnet 4.6.

lab Claude Code Releases · منذ 2 يوم

Claude Code v2.1.197 يُدخل Claude Sonnet 5

أطلقت Anthropic الإصدار 2.1.197 من Claude Code، والذي يحدث النموذج الافتراضي إلى Claude Sonnet 5. يتميز هذا النموذج الجديد بنافذة سياق أصلية بحجم 1M-token وهو متاح بسعر ترويجي حتى 31 أغسطس.

lab OpenAI News · منذ 2 يوم

داخل GeneBench-Pro: 10 دراسات حالة للاستدلال الجينومي المعقد

يُعد GeneBench-Pro معيارًا مصممًا لتقييم النماذج في مهام الاستدلال الجينومي المعقد، ويضم عشر دراسات حالة مفصلة تعرض أسئلة تمثيلية ومواد داعمة. توفر كل دراسة الحالة الموجه الأصلي (prompt)، وبيانات المجموعات، والسياق اللازم لتقييم أداء النموذج على تحديات بيولوجية محددة.

lab OpenAI News · منذ 2 يوم

إطلاق GeneBench-Pro

GeneBench-Pro هو معيار بحثي مصمم لقياس كيفية تعامل وكلاء الذكاء الاصطناعي مع الغموض واتخاذ أحكام ذات عواقب في علم الأحياء الحاسوبي، وهو توسيع للمعيار الأصلي GeneBench. ويتناول قيود التقييمات الحالية من خلال اختبار قدرات من رتبة أعلى مثل التعامل مع ضجيج البيانات، ومراجعة الافتراضات، وتحديد متى تكون النتائج جاهزة لاتخاذ القرار.

lab OpenAI News · منذ 2 يوم

وبائيات ملفات التفريغ: إصلاح خطأ عمره 18 عامًا

حل مهندسو OpenAI أعطاب C++ غير المبررة في بنية Rockset للبيانات من خلال تحديد سببين متميزين: تلف عتادي صامت على مضيف Azure، وظرف سباق قديم عمره 18 عامًا في GNU libunwind.

lab OpenAI News · منذ 2 يوم

كيف توسع اعتماد ChatGPT

تكشف بيانات OpenAI Signals أن اعتماد ChatGPT يتسع ويتعمق عالمياً، حيث يرسل المستخدمون 50% أكثر من الرسائل يومياً ويضاعفون عدد المهام المختلفة التي جربوها بعد ستة أشهر من التسجيل.

github llama.cpp · منذ 2 يوم

إصدار llama.cpp b9849: معالجة عناوين URL عبر IPv6 وثنائيات جديدة

يُقدم إصدار llama.cpp b9849 دعمًا للأدلة الرقمية لأحرف IPv6 المضمنة بين قوسين في سلطات عناوين URL، مما يسمح للخادم بتحليل صيغ [المضيف]:المنفذ وفقًا لـ RFC 3986. يضمن هذا التحديث التنسيق الصحيح لسجلات الاستماع، وعناوين الرؤوس الوكيلية، وإعادة بناء العملاء مع الحفاظ على remote_addr العاري لتتبع كل طلب.

lab Google DeepMind Blog · منذ 2 يوم

ابدأ البناء باستخدام Nano Banana 2 Lite وGemini Omni Flash

أطلقت جوجل نموذجين جديدين للذكاء الاصطناعي، هما Nano Banana 2 Lite وGemini Omni Flash، مصممين لتعزيز قدرات المطورين في بناء تطبيقات ذكية.

lab Hugging Face Blog · منذ 2 يوم

لماذا التخصص حتمي

يجادل المقال بأن التخصص في التعلم الآلي هو اتجاه لا مفر منه مدفوع بالتعقيد المتزايد للنماذج والحاجة إلى خبرة متخصصة في المجال.

github llama.cpp · منذ 2 يوم

إصدار llama.cpp b9848 يصلح get_rows_back الخاص بـ CUDA ويوفر ملفات جاهزة

أصدر مشروع llama.cpp الإصدار b9848، الذي يتضمن إصلاحًا حرجًا للخلفية الخاصة بـ CUDA لحل مشكلات في دالة `get_rows_back` على الجداول التي تتجاوز 65535 صفًا. يعالج هذا التحديث مشاكل ضغط grid-y وأخطاء الخطوة (stride) التي كانت تؤثر سابقًا على عمليات الجداول الكبيرة.

lab Hugging Face Blog · منذ 2 يوم

عرض نتائج Every Eval على صفحات نماذج Hugging Face

قامت Hugging Face بتحديث صفحات نماذجها لعرض نتائج التقييم من مبادرة 'Every Eval'، مما يوفر نظرة شاملة لأداء النماذج عبر معايير تقييم مختلفة. يتيح هذا التكامل للمستخدمين الوصول إلى مجموعة واسعة من المقاييس الموحدة مباشرةً داخل واجهة مركز النماذج.

github llama.cpp · منذ 2 يوم

إصدار llama.cpp b9847 يصلح Gemma E4B MTP FlashAttention

أطلق مشروع llama.cpp الإصدار b9847، الذي يتضمن إصلاحًا لـ Gemma E4B MTP FlashAttention على CUDA وإزالة إعلان قالب غير مستخدم.

media Hugging Face Forums · منذ 2 يوم

Trajlens: مدقق لـ LeRobotDataset، تم تدقيق 100 مجموعة بيانات على Hub

يقدم المؤلف Trajlens، وهو مدقق مفتوح المصدر لفئة LeRobotDataset على Hugging Face Hub، ويبلغ عن نتائج تدقيق 100 مجموعة بيانات عامة عشوائية مميزة بـ 'lerobot'. أظهر التدقيق أن 19 مجموعة بيانات فقط نجحت في التحقق من الصحة، بينما فشلت 13 بسبب أخطاء محددة في الواجهة الأمامية وواجهت 47 أخطاء تحميل أو فترات انتظار.

media Hugging Face Forums · منذ 2 يوم

اقتراح معماري: الشبكة الخصومية المعرفية (EAN) للذكاء الاصطناعي مفتوح المصدر

تقترح طلب ميزة الشبكة الخصومية المعرفية (EAN)، وهي بنية مصممة لتحويل الذكاء الاصطناعي من نظام يعكس الإجماع المؤسسي إلى محرك تحقق لامركزي ومتعدد المنظورات. تهدف هذه النهج إلى القضاء على المناورات السياسية والشركات عن طريق إزالة أي نموذج "لمصدر للحقيقة" واحد.

media Hugging Face Forums · منذ 2 يوم

نقاش مجتمعي حول نماذج LLM مفتوحة المصدر لتطوير روبوتات الدردشة

يسأل موضوع نقاش على منتديات Hugging Face المستخدمين عن نماذج الذكاء الاصطناعي المجانية أو مفتوحة المصدر التي يستخدمونها حاليًا لتطوير روبوتات الدردشة وأسباب تفضيلهم لها.