LLaMA.cpp がバージョン b9784 をリリースしました。これは、32x32 タイル化された重み再パック、改善された dyn.quant 処理、統一されたカーネルパラメータ管理など、Hexagon ベースの MM 演算に対する主要な最適化を含みます。本リリースには、macOS (arm64 および x64)、iOS、Vulkan、ROCm、OpenVINO をサポートする複数の Linux アーキテクチャ向けの新しいバイナリが含まれています。
LLaMA.cpp リリース b9784: Hexagon MM の最適化とクロスプラットフォームバイナリ
翻訳元 English → 日本語