يُقدم إصدار llama.cpp بـ b9699 دعمًا لعمليات MUL_MAT وOUT_PROD بدقة Q1_0 عبر PR #24721. يتضمن الإصدار ثنائيات مُعدّة مسبقًا لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر العديد من البنى وأطر التسريع، بما في ذلك SYCL (FP32 وFP16) وVulkan وCUDA وROCm وOpenVINO.