github llama.cpp · منذ 12 يوم · inference

llama.cpp Release b9716 Adds Batching Support for InternVL

مُترجم من English → العربية

تُضيف الإصدار b9716 من llama.cpp دعم المعالجة الدفعية لـ InternVL، مما يعزز أداء النموذج من خلال معالجة دفعيات فعالة. يتضمن الإصدار تجميعات ثنائية لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر بنية متعددة وخيارات تسريع الأجهزة، بما في ذلك Vulkan وOpenVINO وSYCL وROCm.

الأهمية 0/3 الموثوقية 2/3 llama.cpp

قراءة الأصل