يُقدم إصدار llama.cpp b9731 تحسينًا باستخدام std::partial_sort لتقليل عبء ترتيب الرموز، مما يحسن الأداء من 8.555 مللي ثانية إلى 0.704 مللي ثانية لاختيار أعلى n رمزًا. يتضمن الإصدار ثنائيات جاهزة لـ macOS وLinux وAndroid وWindows وopenEuler عبر بنية متعددة وخيارات تسريع الأجهزة.