A versão b9699 do llama.cpp introduz suporte às operações MUL_MAT e OUT_PROD com precisão Q1_0 por meio do PR #24721. A release inclui binários pré-compilados para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e frameworks de aceleração, incluindo SYCL (FP32 e FP16), Vulkan, CUDA, ROCm e OpenVINO.