La version b9675 de llama.cpp active le support FP16 pour des opérations telles que SQR, SQRT, LOG, SIN, COS et CLAMP. La publication inclut des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures, avec le support de Vulkan, ROCm, OpenVINO, SYCL (FP16 et FP32), ainsi que CUDA 12.4 et 13.3.