Rilis llama.cpp b9670 mencakup perbaikan untuk kasus tepi NVFP4 di llama-graph, seperti memindahkan operasi MUL pasca-GEMM dan membatasi build_ffn ke kombinasi yang didukung. Rilis ini menyediakan biner untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan opsi backend, termasuk CUDA, Vulkan, SYCL, dan OpenVINO.