Versi llama.cpp b9675 mengaktifkan dukungan FP16 untuk operasi seperti SQR, SQRT, LOG, SIN, COS, dan CLAMP. Rilis ini mencakup biner untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur, dengan dukungan untuk Vulkan, ROCm, OpenVINO, SYCL (FP16 dan FP32), serta CUDA 12.4 dan 13.3.