llama.cpp release b9670 には、llama-graph における NVFP4 のエッジケースの修正が含まれています。これには、GEMM 後の MUL 操作の移動や、build_ffn をサポートされている組み合わせに制限することが含まれます。このリリースでは、macOS、Linux、Android、Windows、openEuler 向けのバイナリが提供されており、CUDA、Vulkan、SYCL、OpenVINO を含む複数のアーキテクチャとバックエンドオプションに対応しています。