Rilis llama.cpp b9670 mencakup perbaikan untuk kasus tepi NVFP4 di llama-graph, seperti memindahkan operasi MUL pasca-GEMM dan membatasi build_ffn ke kombinasi yang didukung. Rilis ini menyediakan biner untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan opsi backend, termasuk CUDA, Vulkan, SYCL, dan OpenVINO.
llama.cpp Release b9670: Perbaikan dan Build Baru
Diterjemahkan dari English → Bahasa Indonesia