llama.cpp バージョン b9699 は、PR #24721 経由で Q1_0 精度での MUL_MAT および OUT_PROD 演算のサポートを導入しました。今回のリリースには、macOS、Linux、Android、Windows、openEuler 向けのプリコンパイル済みバイナリが含まれており、SYCL (FP32 および FP16)、Vulkan、CUDA、ROCm、OpenVINO を含む複数のアーキテクチャとアクセラレーションフレームワークに対応しています。