أصدرت llama.cpp الإصدار b9757 مع ثنائيات محدثة لأنظمة macOS وLinux وAndroid وWindows وopenEuler. يزيل هذا الإصدار عملية softmax+sort غير المشروطة في عيّنات top-n-sigma، مما يحسّن كفاءة العيّنة. تدعم التوليفات الجديدة Vulkan وOpenVINO وSYCL وROCm وCUDA على عدة معماريات، بما في ذلك Apple Silicon وARM64.