يتضمن إصدار llama.cpp b9670 إصلاحات لحالات الحافة NVFP4 في llama-graph، مثل نقل عمليات الضرب MUL بعد GEMM وتقييد build_ffn على التوليفات المدعومة. يوفر الإصدار ملفات ثنائية لأنظمة macOS وLinux وAndroid وWindows وopenEuler عبر بنية متعددة وخيارات للخلفية، بما في ذلك CUDA وVulkan وSYCL وOpenVINO.