يحدث إصدار llama.cpp بـ b9677 سجلات التدوين لفرض max_capacity ويزيل منطق توسيع الطابور. يتضمن الإصدار ثنائيات لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر العديد من المعماريات وخيارات تسريع الأجهزة، بما في ذلك Vulkan وCUDA وOpenVINO وSYCL.