كل المقالات
github llama.cpp · منذ 12 يوم

ggml-webgpu يضيف مفاتيح تبديل المحول F16 لـ Vulkan وNVIDIA

أضاف مشروع ggml-webgpu مفاتيح تبديل للمحول لدعم الدقة النصفية (F16) على وحدات معالجة الرسومات Vulkan وNVIDIA. يتيح هذا التحديث أداءً محسّنًا على الأجهزة المتوافقة عبر منصات متعددة، بما في ذلك macOS وLinux وAndroid وWindows وopenEuler، مع توفر إصدارات مخصصة لهندسة ARM وx64.

github llama.cpp · منذ 12 يوم

إصدار llama.cpp b9731: تحسين الأداء وثنائيات عبر المنصات

يُقدم إصدار llama.cpp b9731 تحسينًا باستخدام std::partial_sort لتقليل عبء ترتيب الرموز، مما يحسن الأداء من 8.555 مللي ثانية إلى 0.704 مللي ثانية لاختيار أعلى n رمزًا. يتضمن الإصدار ثنائيات جاهزة لـ macOS وLinux وAndroid وWindows وopenEuler عبر بنية متعددة وخيارات تسريع الأجهزة.

github llama.cpp · منذ 12 يوم

إصدار LLaMA.cpp b9728 يضيف دعم أسطر التعليقات وثنائيات متعددة المنصات

يُقدم إصدار LLaMA.cpp بـ b9728 دعمًا لأسطر التعليقات في تكوين --api-key-file. يتضمن الإصدار ثنائيات مُعدة مسبقًا لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر العديد من المعماريات وخيارات تسريع الأجهزة، بما في ذلك Vulkan وCUDA وOpenVINO وSYCL.

github llama.cpp · منذ 12 يوم

إصدار llama.cpp b9724 مع إصلاحات الأخطاء وثنائيات عبر المنصات

يتضمن إصدار llama.cpp b9724 عدة إصلاحات للأخطاء وتحسينات، مثل إصلاحات البناء، وتجنب تجاوز السعة في دالة area()، وفحص الصحة في get_u32(). يوفر الإصدار ثنائيات مُعدة مسبقًا لأنظمة macOS (arm64 وx64)، وLinux (x64، arm64، s390x، Vulkan، ROCm، OpenVINO، SYCL)، وAndroid (arm64)، وWindows (x64، arm64، CUDA 12/13، Vulkan، OpenVINO، SYCL، HIP)، وopenEuler (x86 وaarch64 مع دعم ACL Graph)، بالإضافة إلى حزمة واجهة المستخدم.

github llama.cpp · منذ 12 يوم

إصدار llama.cpp b9723 يضيف دعمًا لـ Qwen3.5 و Qwen3.6 Eagle3

تقدم إصدار llama.cpp b9723 دعمًا لنماذج Qwen3.5 و Qwen3.6 عبر Eagle3. يتضمن الإصدار استعادة نقاط التفتيش الحدودية المؤجلة للنماذج الهجينة وتحديثات لـ API واتفاقيات التسمية. تتوفر تجميعات ثنائية لمنصات macOS و Linux و Android و Windows و openEuler، مع خيارات لـ CPU و Vulkan و OpenVINO و SYCL و ROCm.

github llama.cpp · منذ 12 يوم

إصدار llama.cpp b9718: اختيار الشرائح الموحد وعمليات البناء الثنائية الجديدة

يجمع إصدار llama.cpp b9718 اختيار الشرائح في دالة واحدة، get_available_slot، مع الحفاظ على فحوصات التشابه LCP لتحديثات ذاكرة التخزين المؤقت للرسائل. يتضمن الإصدار عمليات بناء ثنائية لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر بنية متعددة وخيارات تسريع الأجهزة.

github OpenAI Agents SDK · منذ 12 يوم

ملاحظات إصدار v0.17.6

يضيف الإصدار v0.17.6 حواجز حماية لإدخال الأدوات المعتمدة مسبقًا وبيانات مخصصة عبر SDK فقط لمخرجات الأدوات. كما يفرض عقدًا متوافقًا تمامًا مع JSON لمخرجات الأدوات ويكبح تحذيرات المسافات البيضاء غير الضرورية في أسماء الأدوات. قدم @siddiksawani مساهمته الأولى في هذا الإصدار.

github llama.cpp · منذ 12 يوم

llama.cpp Release b9716 Adds Batching Support for InternVL

تُضيف الإصدار b9716 من llama.cpp دعم المعالجة الدفعية لـ InternVL، مما يعزز أداء النموذج من خلال معالجة دفعيات فعالة. يتضمن الإصدار تجميعات ثنائية لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر بنية متعددة وخيارات تسريع الأجهزة، بما في ذلك Vulkan وOpenVINO وSYCL وROCm.