github llama.cpp · منذ 12 يوم · inference

إصدار llama.cpp b9731: تحسين الأداء وثنائيات عبر المنصات

مُترجم من English → العربية

يُقدم إصدار llama.cpp b9731 تحسينًا باستخدام std::partial_sort لتقليل عبء ترتيب الرموز، مما يحسن الأداء من 8.555 مللي ثانية إلى 0.704 مللي ثانية لاختيار أعلى n رمزًا. يتضمن الإصدار ثنائيات جاهزة لـ macOS وLinux وAndroid وWindows وopenEuler عبر بنية متعددة وخيارات تسريع الأجهزة.

الأهمية 1/3 الموثوقية 2/3 llama.cpp Inference efficiency

قراءة الأصل