LLaMA.cpp リリース b9678 には、decode 用の mul_mat_f16_f32_l4 の最適化が含まれ、macOS、Linux、Android、Windows、openEuler 向けの新しいビルドが導入されました。このリリースでは、複数のアーキテクチャで CPU、Vulkan、ROCm、OpenVINO、SYCL、HIP のサポートを提供し、専用の UI パッケージも利用可能です。
LLaMA.cpp リリース b9678 に最適化とクロスプラットフォームビルドが追加
翻訳元 English → 日本語