كل المقالات
media Hugging Face Forums · منذ 10 يوم

القدرة ليست في الأوزان: نتيجة تجريبية سلبية على إسقاط أوزان MLP

وجدت دراسة تجريبية أن إسقاط أوزان MLP من نموذج محول إلى آخر يفشل في نقل القدرة الدلالية. أدى كل متغير تم اختباره إلى أداء أسوأ من المضيف غير المعدّل، مما يشير إلى قيد هيكلي في إسقاط الأوزان. تتحدى النتائج الادعاءات العامة حول قدرات النماذج المستندة إلى المعايير، وتوضح أن مثل هذه الادعاءات لا تعكس الهندسة الداخلية الفعلية للأوزان.

media Hugging Face Forums · منذ 10 يوم

The Clockwork Dark: محرك RPG سردي يعمل بالذكاء الاصطناعي ويعتمد على التشغيل المحلي أولاً

يُعد The Clockwork Dark محركاً للعبة RPG سردية يعتمد على التشغيل المحلي أولاً ويُدار بواسطة الذكاء الاصطناعي، ويستخدم آلة حالات حتمية لحل جميع ميكانيكيات اللعبة. يتميز بوجود نموذجين لغويين كبيرين (LLMs) مستقلين يرويان القصة، حيث يعمل أحدهما كصوت صبور للعالم، بينما يعمل الآخر كمساعد إلهي غير موثوق به. يوفر اللعبة للاعبين خياراً بين محاربة الفساد الخارق الذي يتسلل أو العيش في حياة هادئة في مخبز، مع اعتبار كلا المسارين نهايتين صالحتين.

media Hugging Face Forums · منذ 10 يوم

عالق إلى ما لا نهاية في حالة 'بدء التشغيل' مع حاوية Docker قيد التشغيل

يبلغ مستخدم عن أن حاوية Docker الخاصة به مع R/Shiny على rocker/r2u تم بناؤها بنجاح وتعرض 'Listening on http://0.0.0.0:7860' في السجلات، لكن المساحة تظل في حالة 'بدء التشغيل' وغير قابلة للوصول. تستمر المشكلة على الرغم من عدم وجود أخطاء في الكود، ويسعى المستخدم إلى انتباه أوسع، مشيراً إلى أنه قد يكون مشكلة جانب المنصة مع Hugging Face.

media Hugging Face Forums · منذ 10 يوم

NOVA-VAD يتفوق على Silero وPyannote وWebRTC في الصوت الضاخم بدقة 93%

يحقق NOVA-VAD، وهو كاشف نشاط صوتي خفيف الوزن وقابل للتفسير، دقة بنسبة 93% على الصوت الضاخم من مجموعة بيانات UrbanSound8K، متفوقًا على WebRTC (58%) وPyannote (62%) وSilero (87%). يستخدم فقط scikit-learn، ولا يتطلب GPU، ويوفر أهمية الميزات ودرجات الثقة باللغة الإنجليزية البسيطة.

media Hugging Face Forums · منذ 10 يوم

مقارنة تصحيح أخطاء على نطاق صغير لـ OLMo-core مع دمج Engram

تُظهر مقارنة تدريب مكونة من 200 خطوة بين نموذج أساسي OLMo3 بحجم 600M ونسخة تحتوي على دمج Engram بأسلوب DeepSeek انخفاضًا في فقدان التدريب والتقييم، واستقرارًا أسرع لمعيار التدرج، وتحسنًا في سلوك التعلم المبكر. يؤدي دمج Engram، المُحقن في الطبقتين 1 و5، إلى زيادة المعلمات القابلة للتدريب إلى حوالي 1.7 مليار مع الحفاظ على زيادة قدرها 40 ألف فقط في المعلمات النشطة لكل رمز، مما يشير إلى استخدام فعال للذاكرة.

media Hugging Face Forums · منذ 10 يوم

الشبكات العصبية الكبيرة كمسرعات معرفية: الخطر ليس الهلوسة فحسب

لا تقتصر الشبكات العصبية الكبيرة على الهلوسة؛ بل تضخم الثقة المفرطة المعرفية البشرية عن طريق تحويل الفرضيات الضعيفة إلى ادعاءات متماسكة ومُصقّلة قبل التحقق من الأدلة. هذا يخلق خطر اليقين المبكر في البحث والسياسة والمجالات الأخرى، ليس لأن النماذج تكذب، ولكن لأنها تُسرّع الميل البشري لتفضيل التفسيرات الأنيقة على عدم اليقين.

media Hugging Face Forums · منذ 10 يوم

المساحة عالقة على 'إعادة التشغيل' للالتزام القديم لأكثر من 16 ساعة

كانت مساحة Hugging Face عالقة في عرض 'إعادة التشغيل' على الالتزام 8240352 لأكثر من 16 ساعة، على الرغم من نجاح بناء التزامات أحدث متعددة. يبدأ الحاوية بشكل سليم في السجلات، لكن حركة المرور لا تتحول أبدًا إلى الإصدار الجديد، ولا تؤثر إجراءات الاسترداد مثل إعادة البناء أو إعادة التشغيل.

github llama.cpp · منذ 10 يوم

إصدار llama.cpp b9752: إعادة هيكلة الخوادم وثنائيات متعددة المنصات

أصدرت llama.cpp الإصدار b9752 مع إعادة هيكلة للخادم تركز على بناء الدفعات، بما في ذلك تحسين معالجة الحالات التي تكون فيها الدفعة كاملة وإصلاح الأخطاء. يتضمن الإصدار ثنائيات جاهزة للأنظمة الأساسية macOS وLinux وAndroid وWindows وopenEuler، ويدعم بنية مختلفة وأطر تسريع مثل CUDA وVulkan وOpenVINO وSYCL.

github llama.cpp · منذ 10 يوم

إصدار llama.cpp b9753: ثنائيات جديدة وإعداد التقارير عن التقدم

يُقدم إصدار llama.cpp بـ b9753 تقارير محسّنة عن التقدم أثناء تحميل نماذج المواصفات، بما في ذلك قائمة "المراحل" جديدة. يتضمن الإصدار ملفات ثنائية لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر معماريات وخيارات تسريع عتادي متعددة، مثل Vulkan وCUDA وOpenVINO وSYCL.

github llama.cpp · منذ 10 يوم

إصدار llama.cpp b9754: محدد قواعد جديد (AC parser) وثنائيات متعددة المنصات

يُقدم إصدار llama.cpp بـ b9754 محدد قواعد AC لتوليد القواعد بشكل أكثر صرامة في وحدة common/peg. يتضمن الإصدار ثنائيات مُعدّة مسبقاً لأنظمة macOS وLinux وAndroid وWindows وopenEuler، ويدعم مختلف البنى المعمارية وتقنيات التسريع مثل Vulkan وCUDA وOpenVINO وSYCL.

github llama.cpp · منذ 11 يوم

إصدار llama.cpp b9750: جملة استدعاء جديدة وثنائيات متعددة المنصات

يُقدم إصدار llama.cpp بـ b9750 تنفيذًا لجملة الاستدعاء ويعكس تغييرًا غير مقصود. يتضمن الإصدار ثنائيات مُعدّة مسبقًا لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر معماريات متعددة وخيارات تسريع الأجهزة، بما في ذلك Vulkan وCUDA وOpenVINO وSYCL.

github llama.cpp · منذ 11 يوم

إصدار llama.cpp b9748 مع ثنائيات جديدة وميزات

أصدرت llama.cpp الإصدار b9748، مضافةً حقلًا "verbose" إلى مخططها، ومتوفرةً ثنائيات لأنظمة macOS وLinux وAndroid وWindows وopenEuler. يتضمن الإصدار دعمًا لوحدة المعالجة المركزية (CPU) وVulkan وOpenVINO وSYCL وROCm عبر معماريات متعددة، مع توفر إصدارات iOS وWindows CUDA وVulkan.

lab Hugging Face Blog · منذ 11 يوم

هل يمكنك التغلب على LoRA في الضبط الدقيق؟

تستكشف دراسة جديدة بدائل لـ LoRA، وهي تقنية الضبط الدقيق الأكثر شعبية، وتقيّم ما إذا كانت الأساليب الأخرى يمكن أن تحقق أداءً أفضل بتكلفة حسابية أقل. وجدت الدراسة أنه بينما تظهر بعض الأساليب وعوداً، إلا أن لا واحدة منها تفوق بشكل متسق على LoRA عبر مهام ومجموعات بيانات متنوعة.