تُضيف الإصدار b9716 من llama.cpp دعم المعالجة الدفعية لـ InternVL، مما يعزز أداء النموذج من خلال معالجة دفعيات فعالة. يتضمن الإصدار تجميعات ثنائية لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر بنية متعددة وخيارات تسريع الأجهزة، بما في ذلك Vulkan وOpenVINO وSYCL وROCm.
llama.cpp Release b9716 Adds Batching Support for InternVL
مُترجم من English → العربية