llama.cpp バージョン b9699 は、PR #24721 経由で Q1_0 精度での MUL_MAT および OUT_PROD 演算のサポートを導入しました。今回のリリースには、macOS、Linux、Android、Windows、openEuler 向けのプリコンパイル済みバイナリが含まれており、SYCL (FP32 および FP16)、Vulkan、CUDA、ROCm、OpenVINO を含む複数のアーキテクチャとアクセラレーションフレームワークに対応しています。
llama.cpp リリース b9699 が SYCL サポートと複数プラットフォームのバイナリを追加
翻訳元 English → 日本語