ينتقل إصدار llama.cpp بـ b9761 بتنزيل النماذج إلى عملية فرعية مخصصة ويضيف تتبع التقدم في الوقت الفعلي عبر /models/sse. يتضمن الإصدار ثنائيات لأنظمة macOS وLinux وAndroid وWindows وopenEuler، ويدعم مختلف البنى ومسرعات الأجهزة مثل CUDA وVulkan وOpenVINO وSYCL.