llama.cpp versi b9699 memperkenalkan dukungan untuk operasi MUL_MAT dan OUT_PROD dengan presisi Q1_0 melalui PR #24721. Rilis ini mencakup biner pra-kompilasi untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan kerangka akselerasi, termasuk SYCL (FP32 dan FP16), Vulkan, CUDA, ROCm, dan OpenVINO.