llama.cpp संस्करण b9699 ने PR #24721 के माध्यम से Q1_0 सटीकता के साथ MUL_MAT और OUT_PROD ऑपरेशन के लिए समर्थन पेश किया है। इस रिलीज़ में कई आर्किटेक्चरों और त्वरण फ्रेमवर्क्स, जिनमें SYCL (FP32 और FP16), Vulkan, CUDA, ROCm, और OpenVINO शामिल हैं, के लिए macOS, Linux, Android, Windows, और openEuler के लिए पूर्व-कंपाइल किए गए बाइनरी शामिल हैं।