كل المقالات
lab OpenAI News · منذ 1 يوم

داخل GeneBench-Pro: 10 دراسات حالة للاستدلال الجينومي المعقد

يُعد GeneBench-Pro معيارًا مصممًا لتقييم النماذج في مهام الاستدلال الجينومي المعقد، ويضم عشر دراسات حالة مفصلة تعرض أسئلة تمثيلية ومواد داعمة. توفر كل دراسة الحالة الموجه الأصلي (prompt)، وبيانات المجموعات، والسياق اللازم لتقييم أداء النموذج على تحديات بيولوجية محددة.

lab OpenAI News · منذ 1 يوم

إطلاق GeneBench-Pro

GeneBench-Pro هو معيار بحثي مصمم لقياس كيفية تعامل وكلاء الذكاء الاصطناعي مع الغموض واتخاذ أحكام ذات عواقب في علم الأحياء الحاسوبي، وهو توسيع للمعيار الأصلي GeneBench. ويتناول قيود التقييمات الحالية من خلال اختبار قدرات من رتبة أعلى مثل التعامل مع ضجيج البيانات، ومراجعة الافتراضات، وتحديد متى تكون النتائج جاهزة لاتخاذ القرار.

github llama.cpp · منذ 1 يوم

إصدار llama.cpp b9849: معالجة عناوين URL عبر IPv6 وثنائيات جديدة

يُقدم إصدار llama.cpp b9849 دعمًا للأدلة الرقمية لأحرف IPv6 المضمنة بين قوسين في سلطات عناوين URL، مما يسمح للخادم بتحليل صيغ [المضيف]:المنفذ وفقًا لـ RFC 3986. يضمن هذا التحديث التنسيق الصحيح لسجلات الاستماع، وعناوين الرؤوس الوكيلية، وإعادة بناء العملاء مع الحفاظ على remote_addr العاري لتتبع كل طلب.

github llama.cpp · منذ 1 يوم

إصدار llama.cpp b9848 يصلح get_rows_back الخاص بـ CUDA ويوفر ملفات جاهزة

أصدر مشروع llama.cpp الإصدار b9848، الذي يتضمن إصلاحًا حرجًا للخلفية الخاصة بـ CUDA لحل مشكلات في دالة `get_rows_back` على الجداول التي تتجاوز 65535 صفًا. يعالج هذا التحديث مشاكل ضغط grid-y وأخطاء الخطوة (stride) التي كانت تؤثر سابقًا على عمليات الجداول الكبيرة.

lab Hugging Face Blog · منذ 1 يوم

عرض نتائج Every Eval على صفحات نماذج Hugging Face

قامت Hugging Face بتحديث صفحات نماذجها لعرض نتائج التقييم من مبادرة 'Every Eval'، مما يوفر نظرة شاملة لأداء النماذج عبر معايير تقييم مختلفة. يتيح هذا التكامل للمستخدمين الوصول إلى مجموعة واسعة من المقاييس الموحدة مباشرةً داخل واجهة مركز النماذج.

lab Microsoft Research Blog · منذ 2 يوم

ميمورا: تمثيل ذاكرة هارموني يوازن بين التجريد والتحديد

تقدم مايكروسوفت ريسيرش ميمورا، وهو إطار عمل للذاكرة الوكيلية قابل للتوسع مصمم لموازنة التجريد والتحديد لمهام الذكاء الاصطناعي طويلة المدى. يفصل النظام محتوى الذاكرة الغني عن هياكل الاسترجاع الخفيفة الوزن، محققاً نتائج جديدة في الصدارة على الاختبارات المعيارية مع استخدام ما يصل إلى 98% أقل من رموز السياق.

lab Claude Code Releases · منذ 2 يوم

ملاحظات إصدار Claude Code v2.1.196

يُقدم إصدار Claude Code 2.1.196 نماذج افتراضية للمنظمة، ومرفقات ملفات قابلة للنقر، وتحسينات في الأمان لموافقات خادم MCP. يعزز التحديث أيضاً موثوقية الجلسات الخلفية، ويصلح مشكلات مختلفة في تقارير حالة الوكيل، ويُحسّن استخدام الرموز (tokens) في سير عمل مراجعة الكود.