La version b9682 de llama.cpp introduit le support Vulkan pour Linux et Windows, permettant l'accélération GPU. La publication inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures, avec des options CPU et GPU incluant CUDA, OpenVINO, SYCL et ROCm.